Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

  • Reiter Kopfdubletten

    Eine Adresse kann mehrmals innerhalb eines Datenbestandes vorkommen. Werden zwei oder mehr gleiche Adressen (Duplikate) gefunden, werden damit Dublettengruppen gebildet.

         Nach dem Adressenabgleich in der Dublettengruppe wird nur eine der Adressen als Kopfdublette, alle anderen als Folgedubletten bewertet. Der bereinigte Datenbestand soll schließlich nur Kopfdubletten enthalten, alle Folgendubletten sollen gelöscht werden.
         Um die Entscheidung zu treffen, welche Adresse als Kopfdublette angesehen wird, verfügt der Data Quality Server über unterschiedliche Methoden.

Image Removed

Image Removed

  • Methode Automatisch: Per Standard wird die Omikron-Automatik verwendet, welche die Kopfdublette nach der Menge an vorhandenem Inhalt (es werden Punkte für die Menge an befüllten Feldern, die Anzahl der Strings und Zeichen vergeben) in den Feldern des Datensatzes auswählt.

         Die Punktwerte können beliebig angepasst werden.


Mit dem Button Image Added können Sie nun weitere Prioritätsregeln für Kopfdubletten ertellen. Die neue Regel erscheint automatisch an Platz eins der Liste der Regeln, die Regeln werden nach Reihenfolge bearbeitet.

Jede weitere neu erstellte Regel wird immer an Platz eins erscheinen.

Sie haben die Möglichkeit unter drei verschiednen Priorisierungsregelnn zu wählen

Image Added

  • Prioritätsfeld: Hier wählen Sie ein Feld der Datenstruktur .Methode Prioritätsfeld: Diese Methode wählt ein Feld aus, dessen Einträge priorisiert werden. Es wird dann jeweils derjenige Datensatz zur Kopfdublette, bei dem der Inhalt des priorisierten Feldes der Prioritätsmethode entspricht, .

         z.B. Feld "PLZ" Methode „Nummerisch aufsteigend“.

         Image Added

         Als Methoden stehen folgende Sortierungskriterien zur Verfügung:

        Image Added

       Anmerkung: "Text aufsteigend" bzw. "Text absteigend" entspricht einer alphabetischen Sortierung.


  • MethodeFeldprioritäten: Diese Methode wählt Wählen Sie ein oder mehrere Felder der Datenstruktur aus, die Einträge enthalten sollen. Es wird dann jeweils derjenige Datensatz zur Kopfdublette, bei dem die benannten Felder Inhalte haben, wenn dies in dem anderen Datensatz nicht der Fall ist.

        Image Added

        Wählen Sie hierzu ein Feld aus dem Dropdown aus und Klicken auf Image Added. Mit Image Addedkönnen Sie einen Feldeintag wieder löschen.

        Image Added


  • Quellprioritäten: Wählen Sie hiermit, die Felder welcher Datenquelle immer als Kopfdublette gelten sollen. Es wird dann jeweils derjenige Datensatz zur Kopfdublette, der aus der Priorisierten Datenquelle stammt.
    • Sie können eine Priorität
      • per numerischer Sortierung je Datenquelle eingeben
      • per Checkbox Nur Kopfdubellte? bestimmen, welche Datenquelle herangezogen werden soll

        Image AddedImage Added


Mit Image Addedkönnen Sie eine ganze Regel wieder löschen.


Diese Methoden können auch kombiniert werden, wobei von oben nach unten überprüft wird, ob die Methode im speziellen Fall eine Entscheidung bringt. Wenn dies nicht der Fall ist, wird die darunterstehende überprüft.

ERGÄNZEN Regel hinzufügenImage Added


Reiter Ergebnisse

Hier definieren Sie den Export Ihrer Ergebnisse. Ausgangsbasis ist dabei die Datenstruktur, welche im Reiter Datastructure definiert wurde.Außerdem werden noch die Statusfelder ergänzt, welche durch die Dublettenprüfung neu entstehen.

...