- Code: Tout sélectionner
function clean_words($mode, &$entry, &$stopword_list, &$synonym_list)
{
static $drop_char_match = array('^', '$', '&', '(', ')', '<', '>', '`', '\'', '"', '|', ',', '@', '_', '?', '%', '-', '~', '+', '.', '[', ']', '{', '}', ':', '\\', '/', '=', '#', '\'', ';', '!');
static $drop_char_replace = array(' ', ' ', ' ', ' ', ' ', ' ', ' ', '', '', ' ', ' ', ' ', ' ', '', ' ', ' ', '', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ' , ' ', ' ', ' ', ' ', ' ', ' ');
[...]
//
// Filter out strange characters like ^, $, &, change "it's" to "its"
//
for($i = 0; $i < count($drop_char_match); $i++)
{
$entry = str_replace($drop_char_match[$i], $drop_char_replace[$i], $entry);
}
il apparait qu'il suffit simplement de rajouter quelques cas au tableau drop_char pour ne plus avoir de mots comme "lautre", "sorienter", etc.
Au lieu de virer juste l'apostrophe comme le fait le code en place, on peut rajouter " s\'" --> ' ', " l\'" --> ' ' comme ca on vire la lettre qui précède l'apostrophe et on garde donc seulement le mot important (et non pas la contraction brutale "lettre + (nom|verbe)" sans apostrophe.
Evidemment tout cela n'est utile que dans le cadre de l'utilisation des tables de recherche pour créer des meta tags en "vrai" francais. Pour la fonction de recherche pure, cela ne sert a rien de retraiter aussi loin

Français |
Anglais


