Ist eine Datenquelle bereits angelegt, haben Sie die Möglichkeit, sowohl Filter als auch Suchumgebungen für diese Datenquelle zu definieren.
Ein Filter ist eine optionale Funktion von Datenquellen. Mit ihm lässt sich die Anzahl der zu verarbeitenden Datensätze einer Datenquelle einschränken. So werden beispielsweise mit Hilfe des Datumsfeldes bei einer Synchronisation mit einem Datenziel nur die Datensätze aktualisiert, die sich seit der letzten Synchronisation verändert haben. Ein weiteres Beispiel ist, bei einer Neuindizierung nur die Datensätze zu verarbeiten, die in einem Feld einen bestimmten Wert aufweisen.
Ein Klick auf dem Button
öffnet den Dialog Filter hinzufügen mit den Einstellungen für die Filter Matrix. Über den Namen ordnen Sie später den Filter einer Aktion (z. B. Pull-Synchronisation) zu. Wählen Sie am besten einen beschreibenden Namen für den Filter. Die Kriterien werden mittels Transact-SQL-Befehlen eingestellt und lassen sich auf alle vom Data Quality Server unterstützten Datenquellen anwenden.Der Filter kann aus einfachen Abfragen sowie UND- und ODER-Verknüpfungen bestehen:
- Einfache Abfrage: Bei einer einfachen Abfrage wählen Sie ein Feld aus und schreiben in das Kriterium-Feld das entsprechende WHERE-Statement.
Beispiel: Sie haben in Ihren Originaldaten ein Feld „Ort“. Sie wollen aber nur die Kunden aus Pforzheim auswählen.
- Mit diesem Filter werden nur die Datensätze bearbeitet, die im Ortsfeld „Pforzheim“ stehen haben.
- UND-Verknüpfung: Bei einer UND-Verknüpfung werden nur Datensätze bearbeitet, die alle Bedingungen erfüllen.
Beispiel: Sie wollen nur die Datensätze bearbeiten, bei denen Informationen im Abteilungsfeld UND im Quellenfeld enthalten sind.
- Wie Sie auf dem Bild sehen, wurden beide gewünschten Felder ausgewählt und mit dem Statement „Feld darf nicht leer sein“ (<>““) versehen.
Immer, wenn mehr als ein Feld ausgewählt ist und die Bedingung in das Kriterium-Feld eingetragen wird, werden die einzelnen Bedingungen mit einem „UND“ verknüpft. - ODER-Verknüpfung: Bei einer ODER-Verknüpfung werden alle Datensätze bearbeitet, die mindestens eine der gestellten Bedingungen erfüllen.
Beispiel: Sie wollen alle Datensätze bearbeiten, die entweder die Postleitzahl „75177“ enthalten oder bei denen als Ort „Pforzheim“ eingetragen ist.
Wie auf dem Bild zu sehen, wurde die eine Bedingung in das Kriterium-Feld, die andere Bedingung in das ODER-Feld eingetragen. Falls eine der Bedingungen zutrifft, wird der Datensatz bearbeitet. Es lassen sich selbstverständlich auch mehrere Verknüpfungen miteinander kombinieren.
Zusätzlich zu den normalen WHERE-Abfragen können funktionsspezifische Variablen angegeben werden, die vor allem bei einer Transformation eingesetzt werden:
- [LastInitialSyncDate] = Alle Datensätze, die seit der letzten Neuindizierung hinzugekommen sind oder verändert wurden, werden bearbeitet.
Da sich der Data Quality Server das Datum der letzten Aktualisierung merkt, ist eine solche Abfrage möglich. Bitte Beachten Sie, dass der Filter nur dann funktioniert, wenn das Datumsfeld in der Transformation richtig eingestellt ist und erkannt wird. Dies gilt für alle hier beschriebenen Datums-Variablen. - [LastUpdateSyncDate] = Alle Datensätze, die seit der letzten Aktualisierung hinzugekommen sind oder verändert wurden, werden bearbeitet.
- [LastLoadDate]: Alle Datensätze, die seit der letzten Neuindizierung oder Aktualisierung hinzugekommen sind oder verändert wurden, werden bearbeitet.
- [LastDeleteDate]/[LastDeleteSyncDate]: Alle Datensätze, die seit der letzten Löschung hinzugekommen sind oder verändert wurden, werden bearbeitet.
- [HighestPKLoad]: Wird dieser Parameter übergeben, werden alle Datensätze bearbeitet, die einen größeren Primärschlüssel besitzen als der zuletzt bearbeitete Datensatz.
Wichtig ist dabei, dass ein geänderter Datensatz in Ihrer Datenquelle, der keinen neuen Primärschlüssel bekommt, vom Data Quality Server in diesem Fall nicht berücksichtigt würde.