| :: |
| Auteur |
Message |
gowap phpBB SEO Team


Inscrit le: 07 Mai 2006 Messages: 990
|
Posté le: Ven Juin 16, 2006 11:41 pm Sujet du message: Codage des pages vu par Google |
|
|
Via les stats google liées a la création d'un compte sitemap je constate qu'a priori Google voit environ 1/6eme de mes pages du forum en ISO-8859-1 (Latin-1) et tout le reste en US-ASCII !!!
Mes pages du forum ont pourtant toutes un
| Code: | | <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1"> |
Pour le site par contre, il voit heureusement les choses en ISO-8859-1 à 99.9% |
|
|
| Revenir en haut de page |
|
 |
|
 |
dcz Administrateur - Site Admin

Inscrit le: 28 Avr 2006 Messages: 13354
|
Posté le: Sam Juin 17, 2006 3:21 pm Sujet du message: Re: Codage des pages vu par Google |
|
|
A mon avis il a raison, tu dois avoir du US-ASCII quelque part, provenant d'un copier coller probablement, ou de commentaires dans du html.
J'en ai aussi
Par contre le 1/6ème, ce doit être des pages explorées pour l'instant dans le cadre des statistiques Google Sitemaps, car ça fait beaucoup quand même.
De toutes façons, je pense que Google comme d'autres à compris que le w3c était le phare dans le tempêtes, il doit pouvoir jongler un peut avec les standards, au pire il loupe une lettre ou deux, mais un mot entier, je ne pense pas. |
_________________ Useful links :
SEO Forum || SEO Directory || SEO phpBB || SEO phpBB3 || Search
____________________
Liens Utiles :
Forum référencement || Annuaire référencement || Référencement phpBB || Référencement phpBB3 || Recherche |
|
| Revenir en haut de page |
|
 |
dcz Administrateur - Site Admin

Inscrit le: 28 Avr 2006 Messages: 13354
|
|
| Revenir en haut de page |
|
 |
gowap phpBB SEO Team


Inscrit le: 07 Mai 2006 Messages: 990
|
Posté le: Lun Juil 24, 2006 1:17 pm Sujet du message: Re: Codage des pages vu par Google |
|
|
Salut,
Qu'est ce que tu entends par html ascii ? |
|
|
| Revenir en haut de page |
|
 |
dcz Administrateur - Site Admin

Inscrit le: 28 Avr 2006 Messages: 13354
|
Posté le: Lun Juil 24, 2006 1:23 pm Sujet du message: Re: Codage des pages vu par Google |
|
|
http://www.w3schools.com/tags/ref_ascii.asp
design :
طراحی
est codé comme suit (sans les espaces) :
| Code: | | & # 1591;& # 1585;& # 1575;& # 1581;& # 1740; |
Du coup tout ce qui rentre pas dans du latin1 ressort codé en html ASCII.
Et ça explique notre interrogation.
Je m'en suis rendu compte en faisant une version UTF-8 des mod rewrite phpBB SEO, pour des sites UTF-8 (perse, cyrillique, chinois etc...) qui utiliseraient tout de même pas mal d'anglais (ou au moins des mot codé en latin) comme un site de design ou de programmation.
C'était donc pour filtrer tout ce qui n'est pas latin avant injection dans les URLs.
++ |
_________________ Useful links :
SEO Forum || SEO Directory || SEO phpBB || SEO phpBB3 || Search
____________________
Liens Utiles :
Forum référencement || Annuaire référencement || Référencement phpBB || Référencement phpBB3 || Recherche |
|
| Revenir en haut de page |
|
 |
gowap phpBB SEO Team


Inscrit le: 07 Mai 2006 Messages: 990
|
Posté le: Lun Juil 24, 2006 1:30 pm Sujet du message: Re: Codage des pages vu par Google |
|
|
J'ai toujours eut beaucoup de mal avec les pages de caracteres et autres joyeusetés, mais bon...
Ok pour la transformation des caracteres etrangers en leur équivalent en entités html. Mais ces entités html, c'est une esperluette, un diese et des chiffres, quelque chose qui est du latin-1. Les 127 premiers caracteres de latin-1 sont les 127 de la table ascii originale. Je ne vois pas pourquoi une page avec & # 1234 serait vu comme du US-ASCII alors que c'est du latin-1.
A ce compte la n'importe quelle page latin-1 sans caractere special propre au latin-1 devrait etre vue comme du us-ascii |
|
|
| Revenir en haut de page |
|
 |
dcz Administrateur - Site Admin

Inscrit le: 28 Avr 2006 Messages: 13354
|
Posté le: Lun Juil 24, 2006 5:34 pm Sujet du message: Re: Codage des pages vu par Google |
|
|
c'est clair, après tout ce temps passé à trouver des alphabets suffisamment simples, les humains remettent ça avec les char-set On a plus qu'à espérer que l'unification prendra moins que 3000 ans
Mais là je crois que tu réponds à ta questions, seul les 127 premiers correspondent, le reste n'en fait pas partie c'est tout. La différence est là tout simplement, il nous arrive de sortir des 127 lettres qui correspondent .
++ |
_________________ Useful links :
SEO Forum || SEO Directory || SEO phpBB || SEO phpBB3 || Search
____________________
Liens Utiles :
Forum référencement || Annuaire référencement || Référencement phpBB || Référencement phpBB3 || Recherche |
|
| Revenir en haut de page |
|
 |
|
|