In den Abgleicheinstellungen können Sie eine Entscheidungsgrundlage definieren, die bestimmt, wie ähnlich zwei Datensätze sein müssen, damit sie einander zugeordnet werden.

Dies ist wichtig um z.B. Dublettensuchen oder Datensatzsuchen sinnvoll zu entwickeln.

Eine Entscheidungsgrundlage wird in einer Matrix mittels prozentualer Werte eingestellt. Zusätzlich können Sie ausgewählen, ob FACT® oder WorldMatch® als Algorithmus verwendet wird.

FACT® ist speziell für den Vergleich lateinischer Zeichensätze konzipiert und besitzt spezielle Anpassungen für Abkürzungen und Hausnummern. Abkürzungen erhalten einen Ähnlichkeitswert von 80% (z. B. „O.“ zu „Omikron“ oder „Inc.“ zu „Incorporated“). Hausnummern, die innerhalb eines Bereiches liegen, erhalten einen Ähnlichkeitswert von 95% (z. B. Hausnummer 4-8 zu Hausnummer 6; Hausnummer 5 würde diesen Ähnlichkeitswert nicht erreichen, da ungerade Hausnummern im Allgemeinen auf der gegenüberliegenden Straßenseite anzutreffen sind).

FACT® kann auch auf nichtlateinische Zeichensätze angewandt werden, jedoch nur innerhalb eines Alphabets.

WorldMatch® ist in der Lage, unterschiedliche Schriftzeichen und Sprachen miteinander zu vergleichen. Zusätzlich können spezielle Anpassungen vorgenommen werden.



Folgende Funktionen sind unter der Rubrik

Abgleicheinstellungen im Data Quality Management Studio zu finden: