Nous sommes le Sam Mai 26, 2012 4:04 pm

News News de Les roBots

Plan de Les roBots » Forum : Les roBots

GoogleBot, MSNBot, Yahoo!Slurp ... Tout sur les robots d'indexations, liste d'ip, User Agents, Crawl et les robots.txt.

Mon robots.txt n'est pas respecté par les robots

Bonjour à tous

En consultant les pages référencées par Google, je me suis aperçue que certaines url étaient indéxées (mais non mises en cache) alors qu'elles sont interdites de crawl par le robots.txt. :shock:

Ces url sont de la forme: -http://www.micro-astuce.com/Forum/post9557.html ou encore
-http://www.micro-astuce.com/Forum/membre60.html

Image

Pourtant, dans les statistiques de spyword, ces urls n'apparaissent pas comme ayant été crawlées.
Image

Le phénomène est visible sur MSN et ...
Lire la suite : Mon robots.txt n'est pas respecté par les robots | Vus : 2062 | Réponses : 9


Disallow ou pas ?

Bonjour,

Ah, ben j'inaugure cette partie du forum on dirait. :D

Je suis en train de modifier mes pages HTML en PHP afin de pouvoir rajouter la commande "include".
J'en ai ajouté 3 en fait :

haut.php
bas.php
gauche.php


Le gain de confort est indiscutable.
En revanche je ne vois pas d'utilité à ce que ces pages soient indéxées individuellement par Google alors j'ai ajouté ceci ...
Lire la suite : Disallow ou pas ? | Vus : 1506 | Réponses : 12


 

Connexion  •  M’enregistrer


Statistiques

48093 message(s) • 6525 sujet(s) • 15368 membre(s)

 
cron