Wortgewichtung

Im Artikel zur Feldgewichtung wird darauf eingegangen, wie man einzelne Felder für die Suche als weniger relevant definiert. Innerhalb eines Feldes und einer Suchphrase sind aber auch nicht alle Wörter gleich relevant. Sogenannte Füllwörter (der, die, das, was, wer, eine, einer etc.) haben keinen Informationsgehalt für die Suche und können daher nahezu ignoriert werden.

FACT-Finder erlaubt die Definition von Füllwörtern und Stoppwörtern. Füllwörter haben einfach keinen Informationsgehalt für die Suche. Stoppwörter sind aber Begriffe, die nicht gefunden werden sollen. Beispielsweise Schimpfwörter oder Begriffe, die dem Markenrecht unterliegen.

Bei der Definition von Stopp- und Füllwörtern sollte jedoch darauf geachtet werden, dass diese nicht in anderer Bedeutung oder Stellen wichtig sind. Ist beispielsweise "die" als Stoppwort definiert, sodass es keinerlei Relevanz bei einer Suchanfrage bekommt, würde eine Suche nach der Musikgruppe "Die Happy" intern nur nach "Happy" suchen und eine Vielzahl von irrelevanten Treffern zurückliefern.

Beispiel 1

Ein Versender von Fahrrädern hat nur Fahrräder in seinem Shop. Jedes Produkt hat das Wort „Fahrrad“ im Produktnamen mit der jeweiligen Bezeichnung: „Fahrrad X12“. Die Suche nach „fahrrad x12“ wird an erster Stelle das richtige Produkt anzeigen. Danach aber folgt der Rest der Datenbank, weil FACT-Finder das Wort „fahrrad“ in allen Datensätzen findet. Für diesen Shop enthält das Wort „fahrrad“ keine relevanten Informationen. Es sollte daher als Füllwort gesetzt werden.

Beispiel 2

In einem Elektronikshop finden sich Substitutprodukte für Markenartikel. Es gibt z. B. ein "Hama Akku nach Sony Art". Aus markenrechtlichen Gründen darf dieser Artikel nicht gefunden werden, wenn nach "Sony" gesucht wird. Dieser Begriff sollte als Stoppwort angelegt werden.

Auswirkung

Die Ähnlichkeit zwischen Suchbegriff und Stoppwörtern fließt nicht in die Datensatzähnlichkeit ein. Die Ähnlichkeit zwischen Suchbegriff und von Füllwörtern beeinflusst die Datensatzähnlichkeit nur gering.

Einstellung ändern

Die Wortliste wird im Konfigurator im Bereich Stoppwörter gepflegt. Ist der Haken in der Spalte Relevanz gesetzt, so betrachtet FACT-Finder das Wort als Füllwort. Ist der Haken entfernt, so wird es als Stoppwort behandelt.

Empfehlung

Die Wortgewichtungen sind in der Regel bereits vorgefüllt, sodass Sie hier im Normalfall keine Änderungen vornehmen müssen.Je nach Ausrichtung der Produktpalette sollte auf die Begriffe „mit“ und „ohne“ geachtet werden. Diese sollten nicht als Stoppwörter definiert werden. Sonst findet die Suche im Zweifel auch entgegengesetzte Produkte.

Auf dieser Seite