quelqu'un connait un outil PHP ou une méthode qui permet d'extraire les mots clés pertinents d'un lien ?
par ex, un truc du genre :
--------
cette page Le Référencement
Forum(13): ce mot figure 13 fois
référencement(6) : ce mot figure 6 fois
--------
j'ai pensé un truc en php :
- prendre le contenu de la page (file_contents)
- explode par un espace et stocker tout les mots dans un tableau
- faire une boucle et sur ces mots pour compter combien de fois ils figurent ...
mais ce processus est très lourd, je me demande aussi si un outil n'est pas déjà existant, car c'est très demandé .... on m'a parlé de tree tagger, mais c'est en java !!
Merci

Français |
Anglais


