WDF*IDF Termgewichtung

WDF*IDF Termgewichtung

IDF*WDF ist einer dieser Formeln, die ein Durchschnittsmensch nicht zwingend im Matheunterricht lernt. Die WDF IDF ist eine Formel die Text basierend ist. Denn nach dieser Formel wird das Verhältnis von guten texten definiert. Denn die Formel rechnet die Worte aus die regelmässig auftauchen mit den Nebeninfos eines Textes.

WDF*IDF steht für wie Within-document Frequency und Inverse Document Frequency.

Die komplette Formel zählt auf der Theorie, dass ein Wort, wenn es häufiger vorkommt, den Text für dieses Wort relevanter macht. Allerdings wird die Auswirkung mit zunehmender Häufigkeit geringer.

Die Formel lautet:

Freq (i,j) bedeutet dabei die Häufigkeit des Keywords in einem Text.

In der SEO wird die Formel vor allem auf die Keyworddichte geachtet. Sie bestimmt wie oft ein Keyword vorkommt. Relevant bei Webseiten wird dies erstrecht in Unterseiten. Sobald ein Themengebiet spezialisierte wird, ist es umso wichtiger dies mit dem Fachbegriff vollzustopfen. Beziehungsweise solange es der WDF*IDF Formel entspricht.

Um das komplette System erneut ihn einer leichteren Sprache zu erklären. Nur weil ein bestimmter begriff in einem Text mehrmalige vorkommt, bedeutet dies nicht dringend, dass es um dieses Wort handelt. Man muss schon viele unterkategorisierte Wörter (auch genannt Proof Terms), benutzen um auf dieses Hauptwort die Konzentration zu lenken. Die ist gut vergleichbar wie eine Deutschaufgabe aus der Grundschule. Finde das Kuckucksei und beschreibe zu welch allen Wörtern das ganze passt.

  • Spatz
  • Storch
  • Elefant
  • Straus
  • Möve

In diesem Fall wäre der Elefant das Kuckucksei. Die Gesammtbezeichung wenn der Elefant ausgeschlossen wäre, wäre nicht Tiere sondern Vogelarten.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.