|
|
|
|
Eviter
le piège du duplicate content |
En
cas de contenu dupliqué, les moteurs de recherche ne présentent
généralement à l'internaute qu'une seule page, et pas forcément
la plus intéressante. Les règles à suivre.
(12/01/2007)
|
|
Après l'avoir déposé en décembre 2001, Google vient d'obtenir
le brevet sur le duplicate content (lire la brève
Le
duplicate content de Google breveté du 08/01/2007).
Le moteur n'avait pas attendu cette certification pour mettre
le filtre en application sur son index.
Le duplicate content, en français "contenu dupliqué",
est la reproduction d'un contenu d'une page sur une autre. Google
a définit l'expression sur son blog officiel à destination des
webmasters : "le contenu dupliqué se rapporte généralement
à des blocs de contenus importants figurant ou non sur un même
nom de domaine, qui se rejoignent complètement ou sont fortement
similaires".
"En clair, il s'agit de plusieurs URL qui ont en substance le
même contenu ou un contenu trop approchant", résume Damien Selosse,
responsable génération trafic au sein de l'agence Rouge Interactif.
Les
conséquences d'un contenu dédoublé peuvent être lourdes pour
un site. En effet, les moteurs de recherche, dans un souci de
qualité, souhaitent épurer leur index de tout doublon. Il est
en effet inutile que l'internaute retrouve plusieurs fois le
même contenu dans différents résultats. Seul moyen pour l'outil
de recherche de lutter contre le phénomène de duplication :
choisir une seule de ses sources. Ainsi, sur 20 pages ayant
un contenu similaire, une seule sortira lors d'une requête.
Les autres pages seront bien indexées par les moteurs, mais
ne sortiront pas dans les résultats.
"Si on laisse le choix au moteur, ce ne sera pas forcément le
bon", souligne Damien Selosse. Pourtant, dans la plupart des
cas, un contenu dupliqué n'est pas volontaire. C'est sur ce
point que réside la problématique du contenu dupliqué : il s'agit
de le neutraliser.
Les points à contrôler comment généralement par les versions
imprimables et les PDF des pages. De nombreux sites proposent
ce type de pages, pensant qu'il s'agit d'une occasion supplémentaire
pour augmenter ses positions. De manière générale, le moteur
effectuera un choix et le risque est d'avoir des visiteurs sur
la page "imprimez" où ne figure en général pas la publicité,
ni le menu du site et les différentes rubriques, "un manque
à gagner" , souligne Damiens Selosse.
"Il
est préférable d'utiliser pour chacune l'extension domaine
pour chaque pays et d'adapter
son discours"
(Damien Selosse - Rouge Interactif)
|
En cas de contenu dédoublé, trois actions peuvent être mises
en place : préciser la page sur le fichier "robot.txt"
pour que le moteur ne l'indexe pas, mettre une règle "no follow"
ou utiliser la redirection 301.
"Afin de clarifier et même si l'information semble évidente,
un site en plusieurs langues n'est pas considéré comme une duplication",
précise-t-il. Par contre, dans le cas de différentes versions
dans une même langue - par exemple un site anglais, américain
et australien - la question du duplicate content devient
trouble. Faut-il ne proposer qu'un seul site ? "Il est
préférable d'avoir différents versions, d'utiliser pour chacune
l'extension domaine pour chaque pays et d'adapter le discours
et les sites à chacune des cibles", conseille Damien Selosse.
Autre phénomène source de duplication : la syndication
de contenu. Rentrant dans la case de "duplicate content", il
ne s'agit pas de l'interdire, solution bien trop radicale pour
le site qui perdrait une source de visiteurs et difficile à
contrôler. En revanche, il est préférable de suivre de près
les sites ayant repris certains contenus, vérifier que la source
est citée avec un lien. "De plus, il faut s'arranger pour avoir
un lien vers le site original dans le contenu repris. Ce qui
permet de bien revendiquer au moteur la source de contenu",
averti au passage le responsable génération trafic de l'agence
Rouge Interactif.
Un travail doit également être mené sur les balises "titre"
et "description". Bien souvent redondante, il est nécessaire
de prendre du temps pour adapter les balises sur chaque page.
"Pour éviter le duplicate content, il faut dans un premier
temps opérer un choix. Ensuite, il s'agit d'être constant dans
ses choix et vérifier continuellement la mise en place de ses
bonnes pratiques", résume Damien Selosse.
Seule difficulté qui pourrait anéantir les efforts d'un site
sur le contenu dupliqué : le Google washing. Faille
découverte par la Dark SEO Team et qui utilise le filtre de
duplicate content. David Degrelle, P-DG de l'agence 1ère Position,
soulignait les effets de cette faille lors d'une enquête sur
la disparition du site Armenager (lire l'enquête sur
la
disparition du site Armenager du 24/08/2006).
"Il est possible en utilisant le filtre de duplication de contenu
et un jeu de redirection spécifique de déréférencer un site,
c'est-à-dire de supprimer les pages dans l'index Google. C'est
un bug, qui n'est toujours pas corrigé à ce jour, et qui - entre
de mauvaises mains - peut avoir des conséquences dramatiques".
|
|
|