Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Reiter Suchumgebungen

Mehr Informationen hierzu finden Sie auch im Kapitel Suchumgebung.

Image RemovedImage Added

  • Suchtiefe: Anzahl der Datensätze, die mit dem aktiven Datensatz verglichen werden.
  • Ermittle optimale Suchtiefe (Checkbox): Ist diese Option ausgewählt, versucht die Software anhand von Stichproben, die sinnvollste Größe der Suchtiefe zu ermitteln. Die Suchtiefe kann aber dadurch nie größer als der voreingestellte Wert werden.
  • Regelsatz: Damit kann die Sortierung anhand von Worldmatch-Regelsätzen beeinflusst werden. Dies ist nur für Dublettensuchen mit Worldmatch-Technologie sinnvoll – nicht mit FACT.
    • Image Added
  • IndexFeld#1: Hier wird ein Feld zugeordnet, für das die Suchtiefe gelten soll.
  • Weitere Spalten: Hier wird die Reihenfolge der Sortierung in der Suchumgebung definiert.
  • Weitere Zeilen: Je Zeile wird eine weitere Suchumgebung definiert.

...


  • Reiter Kopfdubletten

    Eine Adresse kann mehrmals innerhalb eines Datenbestandes vorkommen. Werden zwei oder mehr gleiche Adressen (Duplikate) gefunden, werden damit Dublettengruppen gebildet. Nach dem Adressenabgleich in der Dublettengruppe wird nur eine der Adressen als Kopfdublette, alle anderen als Folgedubletten bewertet. Der bereinigte Datenbestand soll schließlich nur Kopfdubletten enthalten, alle Folgendubletten sollen gelöscht werden.
    Um die Entscheidung zu treffen, welche Adresse als Kopfdublette angesehen wird, verfügt der Data Quality Server über unterschiedliche Methoden.

Image Added

Image Added

Image RemovedImage Added

  • Methode Automatisch: Per Standard wird die Omikron-Automatik verwendet, welche die Kopfdublette nach der Menge an vorhandenem Inhalt (es werden Punkte für die Menge an befüllten Feldern, die Anzahl der Strings und Zeichen vergeben) in den Feldern des Datensatzes auswählt. Die Punktwerte können beliebig angepasst werden.
  • Methode Prioritätsfeld: Diese Methode wählt ein Feld aus, dessen Einträge priorisiert werden. Es wird dann jeweils derjenige Datensatz zur Kopfdublette, bei dem der Inhalt des priorisierten Feldes der Prioritätsmethode entspricht, z.B. „Nummerisch aufsteigend“.
  • Methode Feldprioritäten: Diese Methode wählt ein oder mehrere Felder aus, die Einträge enthalten sollen. Es wird dann jeweils derjenige Datensatz zur Kopfdublette, bei dem die benannten Felder Inhalte haben, wenn dies in dem anderen Datensatz nicht der Fall ist.

...