WDF*IDF beschreibt ein Verfahren, mit dessen Hilfe die Relevanz eines Keywords innerhalb eines Textes gemessen werden kann. Die Methode gilt als Nachfolger der Keyword Density und wird in SEO bei der Erstellung suchmaschinenoptimierter Texte angewendet.
Hintergrund
Suchmaschinen wie Google untersuchen die Textelemente einer Website und versuchen zu erkennen, auf welche Suchanfragen der Content zutrifft. Ursprünglich waren die dafür angewendeten Algorithmen vergleichsweise einfach. Bereits das häufige Vorkommen einzelner Begriffe konnte ausreichen, um die Seite für ein Thema relevant erscheinen zu lassen. Diese sogenannte Keyword Density war jedoch anfällig für Mißbrauch, oft wurden Keywords wahllos in den Text eingebaut. Heute untersuchen Google & Co. Texte anhand unterschiedlichster Faktoren. Die WDF*IDF Formel versucht diese Bewertungssysteme abzubilden. So kann die Relevanz eines Keywords innerhalb eines SEO Textes ähnlich wie von Suchmaschinen selbst bewertet werden.
WDF – Within Document Frequency
Die veraltete Keyword Density misst die Häufigkeit eines Wortes in einem Text, in Relation zur Gesamtzahl aller Wörter des Textes. Kommt ein Wort also drei mal in einem 300-Wörter Text vor, liegt der Wert der Keyword Density bei 1%. Der Nachteil: wie oft das Keyword tatsächlich vorkommt ist irrelevant, solange das Verhältnis zur Gesamtzahl an Wörtern gleich bleibt. Die WDF Formel setzt hier an. Mit jeder Wiederholung eines Wortes nimmt seine Relevanz zu Beginn zu. Ein Logarithmus sorgt nun dafür, dass diese Relevanz-Zunahme geringer wird, je öfter das Wort im Text auftaucht. Die Within Document Frequency bestimmt also die Relevanz eines Wortes in einem Text, ohne diese mit jeder Wiederholung des Wortes unendlich zu steigern.
IDF – Inverse Document Frequency
Der IDF Wert befasst sich mit der „Seltenheit“ eines Wortes innerhalb einer bestimmten Auswahl an Texten. Im Fall von Google betrifft diese Auswahl wohl sämtliche indexierten Texte. Je seltener ein Begriff innerhalb dieser Auswahl vorkommt, desto höher ist sein Wert. Während oft verwendete Wörter wie „und“ nur einen Wert nahe 1 besitzen, ist der Wert von exotischeren Wörtern wie „Suchmaschinenoptimierung“ wesentlich höher. Der Wert hilft also zu bestimmen, welche Wörter in einem Text „besonders“ sind.
Was ist nun WDF*IDF?
Die Multiplikation der beiden Werte ergibt eine Kennzahl. Für sich betrachtet ist dieser Wert jedoch nur bedingt sinnvoll. In der SEO Praxis werden spezielle Tools verwendet. Statt wie Google eine Unmenge an Texten nach einem Keyword zu durchforsten, werden dabei meist die Top15 der Google Suchergebnisse (SERPs) herangezogen. Eine Auswertung ergibt eine Kurve, die in den Texten vorkommende Keywords nach deren WDF*IDF Wert absteigend anzeigt. Der Hintergedanke: erstellt man einen Text, oder optimiert einen Bestehenden nun so, dass die selben Wörter in ähnlicher Häufung vorkommen, sollte eine gutes Ranking erzielt werden. Die WDF IDF Kurve des eigenen Textes muss in diesem Fall der „Standardkurve“, errechnet aus den Top15, ähnlich sein.
Die Annahme ist dabei, dass ein Keyword erst in „Nachbarschaft“ zu den richtigen Wörtern authentisch ist. Texter können mittels WDF IDF Tools bereits beim Erstellen von Content darauf achten, diese „Nachbarn“ einzubauen. Rankt der eigene Text nicht wie gewünscht, kann man zudem versuchen, durch das nachträgliche Einfügen von Keywords aus der WDF*IDF Analyse Anpassungen vorzunehmen.
Kritik
Grundsätzlich widerspricht diese Art der Textoptimierung Googles Rat, Content für den User zu erstellen. Im Bestreben die Idealkurve der WDF*IDF-Tools nachzustellen, geht ein für die Suchmaschine wichtiger Faktor verloren: die Einzigartigkeit. Diese Gratwanderung zwischen Idealwerten und Unique Content ist nur schwer zu meistern. Zudem ist nicht bekannt, welche der über 200 Rankingfaktoren von Google noch für die Bewertung von Texten herangezogen werden.
Fazit
Für viele Suchmaschinenoptimierer und Texter ist WDF*IDF die Methode der Wahl in der Erstellung oder Optimierung von Texten. Wer die Formel als Baukasten-System für Top-Rankings versteht, überschätzt die Magie der Mathematik. Einzigartigkeit ist ebenso gefragt wie „User Friendly“ Content.