Die Suchumgebung ist notwendig, da FACT® und WorldMatch® unscharfe und nicht indizierbare Suchverfahren sind. Um alle Dublettentypen zu finden, müsste jede Adresse mit jeder anderen Adresse verglichen werden. Dies wäre jedoch bei einer größeren Anzahl an Datensätzen selbst von heutigen High-End-Serversystemen nicht mit akzeptablem Zeitaufwand zu bewältigen. Es ist jedoch so, dass nahezu alle Dublettentypen über ein bestimmtes Suchverfahren gefunden werden können, das eine deutliche Reduzierung der Anzahl der Vergleiche erlaubt.

Prinzipiell ist die Suchumgebung dem menschlichen Suchverhalten nachgebildet.

     Nehmen wir für ein Beispiel die Telefonbücher Deutschlands:

     Suchen Sie nun eine Person in diesem Telefonverzeichnis, so lesen Sie nicht alle Telefoneinträge durch, sondern schränken die Suche über die bereits bekannten Informationen der zu suchenden Person ein.

     Zunächst nehmen Sie das gröbste Suchkriterium und verfeinern dann die Kriterien, bis die Einträge, die sie lesen müssen, nur noch wenige Zeilen umfassen.

     Dazu nehmen Sie das entsprechende Telefonbuch aus der Region/dem Ort der zu suchenden Person, suchen dann nach dem Nachnamen und danach nach dem Vornamen. Finden Sie keine exakte Schreibweise, suchen Sie in der Umgebung des Nachnamens nach ähnlichen Schreibweisen.


Die Suchumgebung arbeitet nach dem gleichen Prinzip.

Mit dem Button fügen Sie eine neue Suchumgebung hinzu.

Im Popupfenster können Sie nun Ihre Suchumgebung konfigurieren.

  • Name: Über den von Ihnen vergeben Namen ordnen Sie später die Suchaktion zu. Wählen Sie am besten einen beschreibenden Namen für die Suchumgebung.
  • Suchtiefe: Nach der Erstellung der Indizes definieren Sie noch die Größe der Suchtiefe. Diese legt fest, wie viele Datensätze vor und hinter einem Datenpunkt miteinander verglichen werden. Als Standardwert empfehlen wir 100. Je nach Größe der Datenbank oder Ähnlichkeit der Feldinhalte kann eine Abstufung der Suchtiefe sinnvoll sein.

  • Suchumgebung: Hier definieren Sie beliebige Indizes über mehrere der vorhandenen Datenfelder, über die Sie abgleichen möchten.

         Beginnen Sie dazu mit dem gröbsten Suchbereich, beispielsweise der PLZ oder dem Ortsnamen, und verfeinern Sie die Suche mit weiteren Informationen wie Straßenname, Hausnummer und Firmenname.

         Beachten Sie dabei, dass Sie mehrere Indizes definieren, da im Falle einer Fehlschreibweise in einem der in der Indexumgebung enthaltenen Felder (vor allem dem Indexfeld 1) die Suchumgebung möglicherweise zu keinem Treffer führt.

        Wir empfehlen, dass jedes wichtige Matrix-Feld mindestens einmal in Indexfeld 1 vorkommen soll (üblicherweise sind dies PLZ, Ort und Name).

  • Button fügt ein markiertes verfügbares Feld den Feldern der Suchumgebung hinzu.
  • Button entnimmt ein markiertes Feld der Suchumgebung und führt es in die Liste der verfügbaren Felder zurück.
  • Button  fügt ALLE markierten verfügbaren Felder auf einmal den Feldern der Suchumgebung hinzu.
  • Button  entnimmt ALLE markierten Felder der Suchumgebung und führen sie auf einmal in die Liste der verfügbaren Felder zurück.
  • Button sortiert ein markiertes Feld in der Suchumgebung eine Stufe nach oben.
  • Button sortiert ein markiertes Feld in der Suchumgebung eine Stufe nach unten.


Haben Sie eine Suchumgebung erstellt können Sie folgende Funktionen ausführen:

  • Button Suchumgebung neu laden.
  • Button Suchumgebung hinzufügen
  • Button bestehende Suchumgebung bearbeiten
  • Button eine Suchumgebung löschen
  • Button eine geänderte Suchumgebung speichern



Suchumgebung bei einer Datenquelle

Auf einer Datenquelle muss mindestens eine angelegte Suchumgebung existieren, damit auf dem Datenbestand gesucht werden kann.

Sobald eine Suchumgebung für die Datenquelle angelegt wird, erzeugt der Data Quality Server einen entsprechenden Index in der Datenbank für die Tabelle, auf welche die Datenquelle verweist.


Suchumgebung bei einem Datenziel

Damit FACT® bzw. WorldMatch® auf einem Datenziel suchen können, muss mindestens eine (besser mehrere) Suchumgebung(en) aufgebaut werden.

Für eine FACT-Finder-Datenbank kann eine Suchumgebung auch über die Einstellungen des Genauigkeitsreglers ersetzt werden. Diese Einstellungen sind jedoch indirekter Natur, da sie mehrere Parameter gleichzeitig betreffen.

Bei der Erstellung einer Suchumgebung für ein Datenziel, müssen Sie vor der Nutzung die Suchumgebung mit dem Button indizieren.