Index
Forums
Annuaire
Référencement
Télécharger
  phpBB SEO : Référencement Google, MSN, Yahoo, Annuaires, Forums  
phpBB SEO
Boards
Directory  
SEO  
Downloads
 
  Rechercher Search
    S'enregistrer
Pseudo :  Passe :  Auto  
Register  
 
   
Codage des pages vu par Google

 
Poster un nouveau sujet   Répondre au sujet    phpBB SEO » Forum Référencement  » Forums Google
::  
Auteur Message
gowap
phpBB SEO Team
phpBB SEO Team


Inscrit le: 07 Mai 2006
Messages: 990

Codage des pages vu par GooglePosté le: Ven Juin 16, 2006 11:41 pm    Sujet du message: Codage des pages vu par Google

Via les stats google liées a la création d'un compte sitemap je constate qu'a priori Google voit environ 1/6eme de mes pages du forum en ISO-8859-1 (Latin-1) et tout le reste en US-ASCII !!!

Mes pages du forum ont pourtant toutes un
Code:
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">


Pour le site par contre, il voit heureusement les choses en ISO-8859-1 à 99.9%
Revenir en haut de page
Visiter le site web de l'utilisateur
dcz
Administrateur - Site Admin
Administrateur - Site Admin


Inscrit le: 28 Avr 2006
Messages: 13354

Codage des pages vu par GooglePosté le: Sam Juin 17, 2006 3:21 pm    Sujet du message: Re: Codage des pages vu par Google

A mon avis il a raison, tu dois avoir du US-ASCII quelque part, provenant d'un copier coller probablement, ou de commentaires dans du html.

J'en ai aussi Wink

Par contre le 1/6ème, ce doit être des pages explorées pour l'instant dans le cadre des statistiques Google Sitemaps, car ça fait beaucoup quand même.


De toutes façons, je pense que Google comme d'autres à compris que le w3c était le phare dans le tempêtes, il doit pouvoir jongler un peut avec les standards, au pire il loupe une lettre ou deux, mais un mot entier, je ne pense pas.

_________________
Useful links :
SEO Forum || SEO Directory || SEO phpBB || SEO phpBB3 || Search
____________________

Liens Utiles :
Forum référencement || Annuaire référencement || Référencement phpBB || Référencement phpBB3 || Recherche
Revenir en haut de page
Visiter le site web de l'utilisateur
dcz
Administrateur - Site Admin
Administrateur - Site Admin


Inscrit le: 28 Avr 2006
Messages: 13354

Codage des pages vu par GooglePosté le: Sam Juil 22, 2006 8:54 pm    Sujet du message: Re: Codage des pages vu par Google

En fait, je viens de comprendre, c'est du HTML ASCII, et c'est normale

phpBB code tous les caractères bizarres en HTML ASCII, du coup il y en a forcement un peut dans les pages.

++

_________________
Useful links :
SEO Forum || SEO Directory || SEO phpBB || SEO phpBB3 || Search
____________________

Liens Utiles :
Forum référencement || Annuaire référencement || Référencement phpBB || Référencement phpBB3 || Recherche
Revenir en haut de page
Visiter le site web de l'utilisateur
gowap
phpBB SEO Team
phpBB SEO Team


Inscrit le: 07 Mai 2006
Messages: 990

Codage des pages vu par GooglePosté le: Lun Juil 24, 2006 1:17 pm    Sujet du message: Re: Codage des pages vu par Google

Salut,

Qu'est ce que tu entends par html ascii ?
Revenir en haut de page
Visiter le site web de l'utilisateur
dcz
Administrateur - Site Admin
Administrateur - Site Admin


Inscrit le: 28 Avr 2006
Messages: 13354

Codage des pages vu par GooglePosté le: Lun Juil 24, 2006 1:23 pm    Sujet du message: Re: Codage des pages vu par Google

http://www.w3schools.com/tags/ref_ascii.asp Wink

design :

طراحی

est codé comme suit (sans les espaces) :

Code:
& # 1591;& # 1585;& # 1575;& # 1581;& # 1740;


Du coup tout ce qui rentre pas dans du latin1 ressort codé en html ASCII.

Et ça explique notre interrogation.

Je m'en suis rendu compte en faisant une version UTF-8 des mod rewrite phpBB SEO, pour des sites UTF-8 (perse, cyrillique, chinois etc...) qui utiliseraient tout de même pas mal d'anglais (ou au moins des mot codé en latin) comme un site de design ou de programmation.

C'était donc pour filtrer tout ce qui n'est pas latin avant injection dans les URLs.

++

_________________
Useful links :
SEO Forum || SEO Directory || SEO phpBB || SEO phpBB3 || Search
____________________

Liens Utiles :
Forum référencement || Annuaire référencement || Référencement phpBB || Référencement phpBB3 || Recherche
Revenir en haut de page
Visiter le site web de l'utilisateur
gowap
phpBB SEO Team
phpBB SEO Team


Inscrit le: 07 Mai 2006
Messages: 990

Codage des pages vu par GooglePosté le: Lun Juil 24, 2006 1:30 pm    Sujet du message: Re: Codage des pages vu par Google

J'ai toujours eut beaucoup de mal avec les pages de caracteres et autres joyeusetés, mais bon...

Ok pour la transformation des caracteres etrangers en leur équivalent en entités html. Mais ces entités html, c'est une esperluette, un diese et des chiffres, quelque chose qui est du latin-1. Les 127 premiers caracteres de latin-1 sont les 127 de la table ascii originale. Je ne vois pas pourquoi une page avec & # 1234 serait vu comme du US-ASCII alors que c'est du latin-1.

A ce compte la n'importe quelle page latin-1 sans caractere special propre au latin-1 devrait etre vue comme du us-ascii
Revenir en haut de page
Visiter le site web de l'utilisateur
dcz
Administrateur - Site Admin
Administrateur - Site Admin


Inscrit le: 28 Avr 2006
Messages: 13354

Codage des pages vu par GooglePosté le: Lun Juil 24, 2006 5:34 pm    Sujet du message: Re: Codage des pages vu par Google

c'est clair, après tout ce temps passé à trouver des alphabets suffisamment simples, les humains remettent ça avec les char-set Very Happy On a plus qu'à espérer que l'unification prendra moins que 3000 ans Laughing

Mais là je crois que tu réponds à ta questions, seul les 127 premiers correspondent, le reste n'en fait pas partie c'est tout. La différence est là tout simplement, il nous arrive de sortir des 127 lettres qui correspondent Wink.

++

_________________
Useful links :
SEO Forum || SEO Directory || SEO phpBB || SEO phpBB3 || Search
____________________

Liens Utiles :
Forum référencement || Annuaire référencement || Référencement phpBB || Référencement phpBB3 || Recherche
Revenir en haut de page
Visiter le site web de l'utilisateur
Montrer les messages depuis:   
Poster un nouveau sujet   Répondre au sujet    phpBB SEO » Forum Référencement  » Forums Google
Page 1 sur 1

Navigation Autres sujets de discussion

Sauter vers: