Die Intradublettensuchen ermöglichen Dublettensuchen innerhalb ganzer Tabellen oder auch mehrerer Tabellen gegeneinander.
Ein Mit einem Rechtsklick auf Intradublettensuchen bringt eine Auswahlliste, in der Sie die Option „Intradublettensuchen“ hinzufügen anklicken. Die führt zu folgendem Dialog:
können Sie eine neue Suche anlegen.
Im Anlagedialog können Sie folgende Einstellungen vornehmen:
- Name: Geben Sie einen eindeutigen Namen an. Mit diesem wird Ihre Einstellung abgespeichert und später Name: Mit dem angegebenen Namen wird die Einstellung abgespeichert und vom Data Quality Server aus angesprochen.
- Maximale Prozessoranzahl: Geben Sie hier die maximale Anzahl der Kerne an, mit der die Dublettensuche laufen darf. Dies hat Performanz-Gründe.
Reiter Quelltabellen
- : Hier erscheinen werden Ihnen bereits angelegte Datenquellen und –ziele Datenziele zur Auswahl angezeigt. Per Drag & Drop oder Doppelklick lassen sich diese in den Abgleichbereich „Ausgewählte Datenquellen“ „Ausgewählte Datenquellen“ überführen.
Mit dem Button lassen sich auch Datenquellen Button lassen sich Datenquellen auch direkt aus diesem Dialog anlegen. (siehe Datenquellen anlegen) - Sie haben weiterhin die Möglichkeit mit bereits erstellten Filtern die Datenfelder zur Verarbeitung zu begrenzen.
- Mit der Checkbox Intra-Quellen_Duplikate? legen Sie fest, ob die Datei für den Dublettenabgleich innherhalb der Quelle herangezogen werden soll.
Reiter Datenstruktur
- Workflow auswählen: Als erstes kann hier ein Workflow ausgewählt werdenSie erhalten hier eine Auswahlliste von bereits angelegten Workflows. Dadurch besteht die Möglichkeit im Vorfeld definierte Workflows zu nutzen, um die Daten vor der Dublettensuche aufzubereiten (z. B. Straße und Hausnummer trennen).
- Feldzuordnungen: Um die Tabellenfelder sowohl einander wie auch den Feldern der Suchmatrix zuzuordnen, können diese per Drag & Drop oder Doppelklick in das die betrefende Spalte des Zuordnungsgrid übernommen werden.Hinweis
Anmekung: Achten Sie darauf, dass einander zugeordnete Felder immer denselben Datentyp haben.
- Spalte Datentyp: Hier können Sie den gewünschten Datentyp aus einem Dropdown auswählen.
- Spalte MulitValue (Checkbox): Sie können auswählen, ob es sich um ein Feld mit mehreren gültigen Werten handelt.
- Feldgröße: Hier läßt sich die Zeichenanzahl für ein Feld begrenzen (max. 255 Zeichen)
Bei Betätigung des Buttons Felder zuordnen, werden alle Felder der gewählten Tabelle übernommen. Dies gilt äquivalent für den Button Matrix zuordnen.
...
Hinweis: Die automatische Zuordnung funktioniert nicht bei unähnlichen Namen. Hier müssen die Felder manuell (per Drag & Drop) zugeordnet werden.
- Reiter Suchumgebungen
Grundsätzliches erfahren Sie im Kapitel „Suchumgebung“.
...