Das FACT-Finder Datenziel ist ein dateibasierter Index zur kontextsensitiven Suche über mehrere Felder (mit lateinischem Datensatz). Die Indexdatei wird vom Data Quality Server komplett in den Speicher geladen.

Beispiel für ein FACT-Finder Datenziel:

.factfinder_db = Datenbank-Datei für Volltextsuche

Reiter Grundeinstellungen


Reiter Sucheinstellungen

In diesem Fenster werden alle Felder der Tabelle aufgelistet.

Bei einer FACT-Finder-Suche werden anhand einer Zeichenkette mehrere Felder durchsucht und ein Ergebnis geliefert. Dieses Suchergebnis hat dann eine prozentuale Übereinstimmung mit dem Suchbegriff. Wenn der Suchbegriff in einem abgewerteten Feld gefunden wird, besitzt das Ergebnis eine niedrigere Übereinstimmung – allerdings nur, wenn dieses Feld die höchste Ähnlichkeit zum gesamten Suchstring zeigt. Beispiel: Sie durchsuchen die Felder „Firma“ und „Ort“ und suchen das „Amtsgericht Pforzheim“, suchen aber nur mit dem Suchbegriff „Pforzheim“. Da Pforzheim ein Ort ist, hat jede Firma in Pforzheim eine sehr hohe Übereinstimmung mit dem gesuchten Begriff. Ist der Ort abgewertet, werden nach wie vor alle Firmen gefunden, die in Pforzheim sind, jedoch hat das „Amtsgericht Pforzheim“ eine viel höhere Übereinstimmung als alle anderen Datensätze, da hier Pforzheim (auch) im Feld „Firma“ steht.

Wird der Suchbegriff in dem abgewerteten Feld gefunden, wirkt sich die Abwertung wie folgt aus: Sucht man nach „Pforzheim“ und findet dieses Wort exakt in einem mit 10 % abgewerteten Feld, wird der Ähnlichkeitswert um 2% gesenkt. Diese Funktion verläuft linear, sprich bei 20% Abwertung fällt der Ähnlichkeitswert um 4%. Eine maximale Abwertung von 100 % wirkt sich damit bei einem exakten Treffer mit maximal 20 % geringerer Ähnlichkeit aus – also 80 % Ähnlichkeit.

Bei Teilstrings wirkt sich die Abwertung entsprechend auf die gefundene Ähnlichkeit aus. Beispiel Suche nach „Pforz“, wobei ein Suchfeld den String „Pforzheim“ enthält. Die nicht abgewertete Ähnlichkeit beträgt hier 88,89 %. Ist das Feld mit dem String „Pforzheim“ um 100 % abgewertet, ergibt sich eine endgültige Ähnlichkeit von 71,11 % (= 88,89 – (88,89 * 0,2)). 

Wenn ein Suchfeld aus der Suche ausgeschlossen wird, muss der FACT-Finder-Index neu erzeugt werden, sprich das Datenziel über die Transformation neu beladen. Ein Neuorganisieren des Datenziels reicht nicht aus.

FACT-Finder bietet außer der kontextsensitiven Suche noch weitere Möglichkeiten. Diese werden im Anhang in Abschnitt „Erweiterte FactFinder Datensatz Suche“ beschrieben.