Publié le samedi 11 juillet 2020
Modifié le samedi 13 février 2021 à 11h55 2 min
Modifié le samedi 13 février 2021 à 11h55 2 min
Calculer la fréquence d'un mot dans un texte
Définition : La fréquence d'un mot dans un texte permet de déterminer si ce mot est souvent utilisé et de comparer son utilisation dans plusieurs textes. Cette fréquence est liée au nombre de fois où le mot apparaît et au nombre total de mots dans le texte.
Propriété : La fréquence d'un mot se calcule par la relation :
\(f(mot) = \dfrac{nombre~d'apparitions~du~mot}{nombre~de~mots~dans~le~texte}\)
Cette relation peut aussi s'appliquer aux lettres dans un texte.\(f(mot) = \dfrac{nombre~d'apparitions~du~mot}{nombre~de~mots~dans~le~texte}\)
Remarques :
Pour aller plus loin, vous pouvez voir le système de pondération TF-IDF qui permet de terminer l'importance d'un mot dans un texte.- Une fréquence est toujours comprise entre \(0\) et \(1\) (compris).
- Si un mot est très fréquent dans des textes traitant de sujets divers alors ce mot n'a pas de relation avec un sujet quelconque, il est général (articles, déterminants…).
- Si un mot n'est fréquent que dans des textes sur un sujet précis alors ce mot est probablement lié à ce sujet.
Exemple :
Calculer la fréquence du mot "un" dans le texte : "dans un trou vivait un hobbit".
Ce texte contient \(5\) mots et "un" apparaît deux fois.
La fréquence est donc de \(\frac{2}{5} = 0,4\).
Ce texte contient \(5\) mots et "un" apparaît deux fois.
La fréquence est donc de \(\frac{2}{5} = 0,4\).
retour vers la liste d'articles