Thesaurus verwenden

Mit dem Thesaurus können Sie u.a. Synonyme und Antonyme pflegen.

Synonyme sind wichtig, um FACT-Finder mitzuteilen, welche Worte gleich zueinander sind - und zwar in Fällen, in denen die FACT-Finder-Ähnlichkeit dies nicht selbst erkennen kann. Also immer dann, wenn Wörter eine semantische, aber keine phonetische Ähnlichkeit aufweisen (Beispielsweise Laptop -> Notebook).

Antonyme weisen FACT-Finder darauf hin, dass zwei Worte vom Sinn her nicht gleich sind - und zwar in Fällen, in denen die FACT-Finder-Algorithmik eine Ähnlichkeit melden würde. Also fälschlicherweise immer dann, wenn die Worte phonetisch ähnlich sind, nicht aber semantisch (beispielsweise Ski -> Skin).

Beide Fälle werden in derselben Thesaurus-Liste verwaltet. Den Unterschied macht die Abwertung zwischen der Wortbeziehung. Synonyme haben eine Wortbeziehungs-Abwertung von 0% (also keine Abwertung). Antonyme haben eine Abwertung von 100%. Die Werte dazwischen können verwendet werden, um Wortbeziehungen zu schaffen, die nicht ganz synonym, aber auch nicht vollständig antonym sind (beispielsweise Jeans -> Hose). Diese Wortbeziehung würde man mit wenigen Prozent abwerten (z. B. 5%), damit eine Suche nach Jeans zwar auch die Cord-Hosen findet, aber zuerst alle Jeans anzeigt.

FACT-Finder sucht in seiner Thesaurus-Liste nur exakt, nicht fehlertolerant. Existiert ein Thesaurus-Eintrag Hose -> Jeans und sucht man nach "hosen", würde FACT-Finder den Thesaurus-Eintrag ignorieren.

FACT-Finder arbeitet die Thesaurus-Liste rekursiv ab. Das bedeutet: Gibt es eine Verkettung zwischen Thesaurus-Einträgen, so erkennt FACT-Finder auch diese Beziehung.

Beispiel 1

Folgende Thesaurus-Einträge sind gemacht:

Hosen -> Hose

Hose -> Jeans

Bei einer Suchanfrage "hosen" würde FACT-Finder nach Hosen, Hose und Jeans suchen. Diese Verkettung kann bis zu einer Tiefe von 6 reichen.

Der in FACT-Finder implementierte Thesaurus ist ein Ein-Wort-Thesaurus. Beziehungen zwischen Phrasen sind technisch nicht möglich.

Beispiel 2

Hose -> Jeans (OK)

Blaue Hose -> Jeans (Falsch, "Blaue Hose" sind zwei Wörter)

Blau-Hose -> Jeans (OK, - wird als Wortzeichen erkannt)

R.E.M -> REM (Falsch, der Punkt ist ein Wort-Trenner. Das macht R.E.M zu drei Wörtern.)

Auswirkung

FACT-Finder betrachtet auf Wunsch auch Wörter als ähnlich, die nach der FACT-Finder-Algorithmik normalerweise nicht ähnlich wären. Und umgekehrt: Wörter, die nach der FACT-Finder-Algorithmik ähnlich sind, können als unähnlich markiert werden.

Einstellung ändern

Die Thesaurusliste pflegen Sie über den Bereich Thesaurus oder über die Suchdiagnose. In der Suchdiagnose kann allerdings nur suchbegriffsbezogen gearbeitet werden, die komplette Liste steht dort nicht zur Verfügung..

Empfehlung

Generell kann man sagen, dass in fast allen Fällen Abwertungen von 100% oder 0% verwendet werden, da man dieses Werkzeug für die Pflege von Synonymen und Antonymen verwendet. Zusätzlich können auch Abwertungen von ein paar Prozent (<5%) verwendet werden, um die Beziehung zwischen den Wörtern darzustellen. Alle Werte darüber hinaus sind im Normalfall nicht notwendig.

Aufgrund der Konstruktion können aus Synonymen leicht Synonymketten entstehen, denn wenn Brötchen gleich Semmel und Semmel gleich Schrippe ist, dann ist auch Brötchen gleich Schrippe. Es empfiehlt sich daher, nicht absolut gleiche Bedeutungen durch leichte Abwertungen (z. B. 0,1% oder 0,2%) zu strukturieren. Auf diese Weise kann eine Synonymkette nicht so leicht Suchergebnisse „zerstören“.

Auf dieser Seite