Nous sommes le Dim Fév 12, 2012 5:47 pm

News News de Les roBots

Plan de Les roBots » Forum : Les roBots

GoogleBot, MSNBot, Yahoo!Slurp ... Tout sur les robots d'indexations, liste d'ip, User Agents, Crawl et les robots.txt.

Comment détecter un aspirateur et le filtrer ?

Bonjour. Je sollicite votre aide aujourd'hui. Je soupçonne des programmes ou robots de vouloir aspirer mon site (pour la même IP, plusieurs pages vues... rien d'un comportement humain...)

Existe-t-il un script qui me permettrait (en PHP ou HTACCESS ou robots.txt) de DETECTER ce type de robot : une IP parcourant X pages avec un intervalle d'un temps Y ?

Merci de votre aide !
Lire la suite : Comment détecter un aspirateur et le filtrer ? | Vus : 211 | Réponses : 6


URL à accès restreint par un fichier robots.txt URL à accès restreint par un fichier robots.txt

Bonjour,

voila j'ai un site internet et je vient de voir dans les outils pour les webmaster
133 URL à accès restreint par un fichier robots.txt


est il possible de m'explique les démarche à suivre pour que le robot.txt puise explorer les fichier
pour information je suis sur prestashop

:oops: désoler je ne connais pas trop en informatique :oops:
Lire la suite : URL à accès restreint par un fichier robots.txt | Vus : 116 | Réponses : 0


Nouveau robot google

Salut all,

Je viens de m'apercevoir que google a un nouveau robot pour l'affichage des pages en temps reels sur son moteur.
Je viens de le controler et voici comment le repérer :
Nom : Google Web Preview
Agent : Google Web Preview
J'ai fais plusieurs tests sur les ip, mais pas de moyen de gerer avec car trop differents.

Enjoy.
Lire la suite : Nouveau robot google | Vus : 411 | Réponses : 10


Probleme URL à accès restreint par un fichier robots.txt

Bonjour,

Je viens de me rendre compte que dans outils dans l'outils webmaster de google, il rencontre 848 pages URL à accès restreint par un fichier robots.txt et ce qui me fait un peu peur !!!!

User-agent: *
Disallow: /forum/viewtopic.php?
Disallow: /forum/viewforum.php?
Disallow: /forum/index.php?
Disallow: /forum/posting.php?
Disallow: /forum/groupcp.php
Disallow: /forum/profile.php?
Disallow: /forum/memberlist.php
Disallow: /forum/login.php
Disallow: /index.php?
Disallow: /modules/
Disallow: /bulletin-board-lc2/
Disallow: /php-lc1/
Disallow: /galleries-photos/
Disallow: /sub_folder/
Pouvez vous me dire comment régler ce problème, car ...
Lire la suite : Probleme URL à accès restreint par un fichier robots.txt | Vus : 943 | Réponses : 3


les inconvénients d'un robots.txt qui comporte

Bonsoir
quel sont les inconvénients d'un robots.txt qui comporte juste ce deux lignes ?

User-Agent: *
Disallow:

Merci

User-Agent: *
Disallow: = ( Exclusion d'aucune page (équivalent à l'absence de fichier robots.txt, toutes les pages sont visitées)
Lire la suite : les inconvénients d'un robots.txt qui comporte | Vus : 362 | Réponses : 1


 

Connexion  •  M’enregistrer


Statistiques

47871 message(s) • 6448 sujet(s) • 15068 membre(s)