Die Suchumgebung ist notwendig, da es sich bei FACT® und WorldMatch® um unscharfe und nicht indizierbare Suchverfahren handelt.

Um alle Dublettentypen zu finden, müsste jede Adresse mit jeder anderen Adresse verglichen werden. Selbst bei Einsatz modernster High-End-Serversystemen sind die zu erzielenden Anwortzeiten dabei nicht akzeptabel.


Durch Einsatz der Omikron-Suchumgebung kann die Anzahl der notwendigen Vergleiche stark reduziert werden. Die Suchumgebung ist dabei dem menschlichen Suchverhalten nachgebildet.

Beispiel

Wenn Sie z. B. in einem Telefonbuch nach einer Person suchen, dann lesen Sie nicht alle Telefoneinträge durch, sondern schränken die Suche über bereits bekannte Informationen der zu suchenden Person ein.

Zunächst nehmen Sie das gröbste Suchkriterium und verfeinern dann die Kriterien, bis die Einträge, die Sie lesen müssen, nur noch wenige Zeilen umfassen.

Dazu nehmen Sie das entsprechende Telefonbuch aus der Region der zu suchenden Person, suchen zuerst nach dem Nachnamen und danach nach dem Vornamen.

Finden Sie keine exakte Schreibweise, suchen Sie in der Umgebung des Nachnamens nach ähnlichen Schreibweisen.


Die Suchumgebung arbeitet nach dem gleichen Prinzip. Es werden dazu beliebige Indizes über mehrere Felder, über die abgeglichen wird, definiert.

Dazu beginnen Sie mit dem gröbsten Suchbereich, beispielsweise der PLZ oder dem Ortsnamen, und verfeinern die Suche mit weiteren Informationen wie Straßenname, Hausnummer und Name.

Es sollten mehrere Indizes definiert werden, da im Falle einer Fehlschreibweise in einem der in der Indexumgebung enthaltenen Felder (vor allem dem Indexfeld 1) die Suchumgebung nicht zu einem Treffer führen kann.

Wir empfehlen, dass jedes wichtige Matrix-Feld mindestens einmal in Indexfeld 1 vorkommt (üblicherweise sind dies PLZ, Ort und Name).

Nach der Erstellung der Indizes definieren Sie die Größe der Suchtiefe. Diese legt fest, wie viele Datensätze vor und hinter einem Datensatz miteinander verglichen werden.

Als Standardwert empfehlen wir 100.

Bei besonders großen Datenbeständen oder besonderen Ähnlichkeiten in Sortierfeldern (z. B. Daten aus einer bestimmten PLZ-Region), sollte dieser Wert evtl. höher gewählt werden.


Zum Erstellen einer Suchumgebung gehen Sie wie folgt vor:

  • Im linken Bereich des DQ-Server Management Studios sollte nun ein Eintrag im Bereich „Datenziele“ mit dem weiter oben definierten Namen des Datenziels „Dialogsuche“ vorhanden sein.
  • Erweitern Sie die Liste des Datenziels durch einen Klick auf das Symbol.
  • Führen Sie einen Rechtsklick auf den nun sichtbaren Eintrag „Suchumgebungen“ durch und klicken anschließen auf „Suchumgebung hinzufügen“.
  • Daraufhin erscheint der Dialog „Suchumgebung hinzufügen“.
    • Hier gibt es folgende Optionen:
    • Name: Ein frei wählbarer Name für die Suchumgebung. Verwenden Sie als Name aus Gründen der Nachvollziehbarkeit am besten die Bezeichnungen sämtlicher Felder, die in der Suchumgebung auftauchen (Beispiel: Livedaten_Suche_PLZ_Str_HNr_Name).
    • Suchtiefe: Hier wählen Sie die Anzahl der Datensätze aus, die mit dem zu überprüfenden Datensatz verglichen werden sollen. Es werden die Datensätze genommen, die in der Sortierung der jeweiligen Suchumgebung direkt vor und nach dem zu überprüfenden Datensatz stehen. Diese Zahl sollte von Faktoren wie der Datenmenge im Datenziel und spezifischen Ähnlichkeiten in den Suchfeldern abhängen.
    • Suchumgebung: Verschieben Sie hier alle Feldnamen, nach denen die Suchtabelle sortiert werden soll, von „Verfügbare Felder“ in den rechten Bereich „Felder der Suchumgebung“ (Beispiel: PLZ, Strasse, Hausnummer, Name).
  • Klicken Sie nun auf den Button „OK“, um die Suchumgebung für das Datenziel anzulegen.

Beispiel einfügen






  • No labels