Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Die Suchumgebung ist notwendig, da FACT® und WorldMatch® unscharfe und nicht indizierbare Suchverfahren sind. Um alle Dublettentypen zu finden, müsste jede Adresse mit jeder anderen Adresse verglichen werden. Dies wäre jedoch bei einer größeren Anzahl an Datensätzen selbst von heutigen High-End-Serversystemen nicht mit akzeptablem Zeitaufwand zu bewältigen. Es ist jedoch so, dass nahezu alle Dublettentypen über ein bestimmtes Suchverfahren gefunden werden können, das eine deutliche Reduzierung der Anzahl der Vergleiche erlaubt.

Image Added

Prinzipiell ist die Suchumgebung dem menschlichen Suchverhalten nachgebildet.

     Nehmen wir für ein Beispiel die Telefonbücher Deutschlands:

     . Suchen Sie nun eine Person in diesem Telefonverzeichnis, so lesen Sie nicht alle Telefoneinträge durch, sondern schränken die Suche über die bereits bekannten Informationen der zu suchenden Person ein.

     Zunächst nehmen Sie das gröbste Suchkriterium und verfeinern dann die Kriterien, bis die Einträge, die sie lesen müssen, nur noch wenige Zeilen umfassen.

     Dazu nehmen Sie das entsprechende Telefonbuch aus der Region/dem Ort der zu suchenden Person, suchen dann nach dem Nachnamen und danach nach dem Vornamen. Finden Sie keine exakte Schreibweise, suchen Sie in der Umgebung des Nachnamens nach ähnlichen Schreibweisen.

...

Die Suchumgebung arbeitet nach dem gleichen Prinzip. Definieren Sie dazu .

Mit dem Button Image Added fügen Sie eine neue Suchumgebung hinzu.

Im Popupfenster können Sie nun Ihre Suchumgebung konfigurieren.

Image Added

  • Name: Über den von Ihnen vergeben Namen ordnen Sie später die Suchaktion zu. Wählen Sie am besten einen beschreibenden Namen für die Suchumgebung.
  • Suchtiefe: Nach der Erstellung der Indizes definieren Sie noch die Größe der Suchtiefe. Diese legt fest, wie viele Datensätze vor und hinter einem Datenpunkt miteinander verglichen werden. Als Standardwert empfehlen wir 100. Je nach Größe der Datenbank oder Ähnlichkeit der Feldinhalte kann eine Abstufung der Suchtiefe sinnvoll sein.

Image Added

  • Suchumgebung: Hier definieren Sie beliebige Indizes über mehrere der

...

  • vorhandenen Datenfelder, über die Sie abgleichen möchten.

         Beginnen Sie dazu mit dem gröbsten Suchbereich, beispielsweise der PLZ oder dem Ortsnamen, und verfeinern Sie die Suche mit weiteren Informationen wie Straßenname, Hausnummer und Firmenname.

         Beachten Sie dabei, dass Sie mehrere Indizes definieren, da im Falle einer Fehlschreibweise in einem der in der Indexumgebung enthaltenen Felder (vor allem dem Indexfeld 1) die Suchumgebung möglicherweise zu keinem Treffer führt.

        Wir empfehlen, dass jedes wichtige Matrix-Feld mindestens einmal in Indexfeld 1 vorkommen soll (üblicherweise sind dies PLZ, Ort und Name).

Nach der Erstellung der Indizes definieren Sie die Größe der Suchtiefe. Diese legt fest, wie viele Datensätze vor und hinter einem Datensatz miteinander verglichen werden. Als Standardwert empfehlen wir 100. Je nach Größe der Datenbank oder Ähnlichkeit der Feldinhalte ist jedoch eine Anpassung der Suchtiefe angeraten.

  • Button Image Added fügt ein markiertes verfügbares Feld den Feldern der Suchumgebung hinzu.
  • Button Image Added entnimmt ein markiertes Feld der Suchumgebung und führt es in die Liste der verfügbaren Felder zurück.
  • Button Image Added fügt ALLE markierten verfügbaren Felder auf einmal den Feldern der Suchumgebung hinzu.
  • Button Image Added entnimmt ALLE markierten Felder der Suchumgebung und führen sie auf einmal in die Liste der verfügbaren Felder zurück.
  • Button Image Addedsortiert ein markiertes Feld in der Suchumgebung eine Stufe nach oben.
  • Button Image Added sortiert ein markiertes Feld in der Suchumgebung eine Stufe nach unten.


Haben Sie eine Suchumgebung erstellt können Sie folgende Funktionen ausführen:

  • Button Image Added Suchumgebung neu laden.
  • Button Image Added Suchumgebung hinzufügen
  • Button Image Added bestehende Suchumgebung bearbeiten
  • Button Image Added eine Suchumgebung löschen
  • Button Image Added eine geänderte Suchumgebung speichern



Suchumgebung bei einer Datenquelle

Auf einer Datenquelle muss mindestens eine angelegte Suchumgebung existieren, damit auf dem Datenbestand gesucht werden kann.

Sobald eine Suchumgebung für die Datenquelle angelegt wird, erzeugt der Data Quality Server einen entsprechenden Index in der Datenbank für die Tabelle, auf welche die Datenquelle verweist.

Image AddedImage Removed


Suchumgebung bei einem Datenziel

Damit FACT Damit FACT® bzw. WorldMatch® auf einem Datenziel suchen können, muss mindestens eine (besser mehrere) Suchumgebung(en) aufgebaut werden.

Für eine FACT-Finder-Datenbank kann eine Suchumgebung auch über die Einstellungen des Genauigkeitsreglers ersetzt werden. Diese Einstellungen sind jedoch indirekter Natur, da sie mehrere Parameter gleichzeitig betreffen.

Suchumgebung bei einer Datenquelle

Image Added

Bei der Erstellung einer Suchumgebung für ein Datenziel, müssen Sie vor der Nutzung die Suchumgebung mit dem Button Image Added indizierenAuch auf einer Datenquelle muss mindestens eine angelegte Suchumgebung existieren, damit auf dem Datenbestand gesucht werden kann. Sobald eine Suchumgebung für die Datenquelle angelegt wird, erzeugt der Data Quality Server einen entsprechenden Index in der Datenbank für die Tabelle, auf welche die Datenquelle verweist.