DSI 
Sommaire DSI
Référencement : les caractères spéciaux sous haute surveillance
Les moteurs de recherche n'indexent pas tous les caractères contenus dans le code HTML. Comment, dès lors, réussir leur bonne intégration ? Des experts du référencement distillent leurs conseils.  (09/12/2005)
  En savoir plus
 @position
 1ère Position
 Comment ne pas rater son référencement
Le référencement dans les moteurs de recherche figure parmi les priorités des entreprises développant ou faisant développer leur site Web. Sans revenir sur l'intégralité des conseils à la fois marketing et techniques, il est vital d'avoir une gestion méticuleuse des titres et du contenu des pages.

En effet, ces pages, qu'elles soient statiques (HTML) ou dynamiques (PHP, ASP), acceptent tous types de caractères. Mais les moteurs n'ont, de leur côté, pas une faculté aussi poussée. Il convient donc d'harmoniser la création des pages Web avec la gestion - parfois déroutante - des caractères et mots-clés par ces derniers.

La complexité du référencement apparaît pleinement avec les caractères spéciaux. En effet, la majorité des moteurs de recherche et des technologies a été développée par des anglophones. Ces derniers - avec une langue si pratique pour les systèmes informatiques - n'ont pas toujours pensé à leurs confrères étrangers dont la langue utilise parfois, par exemple, des caractères accentués, dits "spéciaux".

"Ceci fut tout du moins vrai lorsque le codage était hétérogène, avec plusieurs normes, comme l'ISO 852 ou l'UTF8", nous rappelle Jérôme Spiral, directeur de la production chez @position, société spécialisée dans le référencement. "Mais le codage CML introduit par la suite a permis d'unifier toutes ces normes pour la prise en charge d'un alphabet commun, permettant l'affichage de tous ces caractères sans filtre supplémentaire", ajoute-t-il.

Le CML a cependant quelques limites, en particulier avec les alphabets jugés "exotiques". Le chinois, le japonais, le russe et l'hébreu ne sont pas toujours pris en compte comme souhaité. Ceci s'applique au contenu des pages. Pour la gestion des noms de fichiers, c'est encore différent.

"Le nom de domaîne et l'arborescence doivent être lisibles, c'est un vecteur de communication essentiel"
(David Degrelle - 1ère Position)
"C'est pourquoi il est préférable pour tous les concepteurs de sites, y compris les rédacteurs de pages Web, de nommer les fichiers sans accents et sans tous les autres caractères spéciaux", conseille David Degrelle, P-DG de la société 1ère Position.

Le dirigeant rappelle en outre le rôle essentiel du titrage de la page et d'une URL explicite. "Le nom de domaîne et l'arborescence doivent être lisibles, c'est un vecteur de communication essentiel".

Même si la plupart des sites Internet sont aujourd'hui dynamiques, avec de nombreuses requêtes, rien n'empêche une ré-écriture de l'URL pour transformer une adresse interrogeant une base données en une adresse lisible (lire l'article du 07//04/2002 sur l'URL rewriting).

Parmi ces caractères spéciaux proscrits - car mal interprétés par Google et les autres moteurs - les accents s'en sortent bien grâce au code HTML qui les autorise avec des balises spécifiques (le fameux "&eacute" pour la transcription du "é"). Cependant, les noms de domaine et les fichiers ne travaillent pas avec ces balises. Dès lors, les moteurs de recherche se sont affranchis de toute compatibilité.

Ces caractères spéciaux ne s'arrêtent pas aux accents, le clavier informatique en possédant bien d'autres comme les opérateurs "+" et "-". Le problème vient de leur gestion par les moteurs : le "+" est considéré comme un espace - ou séparateur - qui permet de spécficier les mots clés à chercher. Le "-" remplit quant à lui les mêmes fonctions. Mais avec un espace mal placé devant, il évincera le terme suivant pour limiter la recherche au premier mot clé.

La gestion des tirets est elle-aussi primordiale. Le tiret bas (ou underscore) doit être évité car, dans une recherche, il associe tous les mots clés en un seul. Qui plus est, cette règle doit être appliquée dans la nomination des fichiers. Pour pouvoir être indexé correctement, le nom d'un fichier Web doit être séparé par le "-" pour dissocier les mots clés.

  En savoir plus
 @position
 1ère Position
 Comment ne pas rater son référencement
Cette gestion des caractères spéciaux est importante mais n'est qu'une partie des bonnes règles de référencement. "Au niveau des noms de domaine, l'ancienneté prime bien avant les mots-clés", rappelle David Degrelle.

 
 
Christophe COMMEAU, JDN Solutions Sommaire DSI
 
 
Accueil | Haut de page
 
 

  Nouvelles offres d'emploi   sur Emploi Center
Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Toutes nos newsletters