Logo du site de mathématiques Calculus Logo du site de mathématiques Calculus
Calculer la fréquence d'un mot dans un texte - Calculus


Publié le samedi 11 juillet 2020
Modifié le samedi 13 février 2021 à 11h55
 2 min

Calculer la fréquence d'un mot dans un texte

Définition : La fréquence d'un mot dans un texte permet de déterminer si ce mot est souvent utilisé et de comparer son utilisation dans plusieurs textes. Cette fréquence est liée au nombre de fois où le mot apparaît et au nombre total de mots dans le texte.
Propriété : La fréquence d'un mot se calcule par la relation :
\(f(mot) = \dfrac{nombre~d'apparitions~du~mot}{nombre~de~mots~dans~le~texte}\)
Cette relation peut aussi s'appliquer aux lettres dans un texte.
Remarques :
  • Une fréquence est toujours comprise entre \(0\) et \(1\) (compris).

  • Si un mot est très fréquent dans des textes traitant de sujets divers alors ce mot n'a pas de relation avec un sujet quelconque, il est général (articles, déterminants…).

  • Si un mot n'est fréquent que dans des textes sur un sujet précis alors ce mot est probablement lié à ce sujet.
Pour aller plus loin, vous pouvez voir le système de pondération TF-IDF qui permet de terminer l'importance d'un mot dans un texte.
Exemple :
Calculer la fréquence du mot "un" dans le texte : "dans un trou vivait un hobbit".
Ce texte contient \(5\) mots et "un" apparaît deux fois.
La fréquence est donc de \(\frac{2}{5} = 0,4\).

retour vers la liste d'articles