REFERENCEMENT 
Sommaire Moteur-Référencement 
Eviter le piège du duplicate content
En cas de contenu dupliqué, les moteurs de recherche ne présentent généralement à l'internaute qu'une seule page, et pas forcément la plus intéressante. Les règles à suivre.   (12/01/2007)
  En savoir plus
 Rouge Interactif
 Damien Selosse
Séminaire Benchmark Comment optimiser son site pour le référencement
Après l'avoir déposé en décembre 2001, Google vient d'obtenir le brevet sur le duplicate content (lire la brève Le duplicate content de Google breveté du 08/01/2007). Le moteur n'avait pas attendu cette certification pour mettre le filtre en application sur son index.

Le duplicate content, en français "contenu dupliqué", est la reproduction d'un contenu d'une page sur une autre. Google a définit l'expression sur son blog officiel à destination des webmasters : "le contenu dupliqué se rapporte généralement à des blocs de contenus importants figurant ou non sur un même nom de domaine, qui se rejoignent complètement ou sont fortement similaires".

"En clair, il s'agit de plusieurs URL qui ont en substance le même contenu ou un contenu trop approchant", résume Damien Selosse, responsable génération trafic au sein de l'agence Rouge Interactif.

Les conséquences d'un contenu dédoublé peuvent être lourdes pour un site. En effet, les moteurs de recherche, dans un souci de qualité, souhaitent épurer leur index de tout doublon. Il est en effet inutile que l'internaute retrouve plusieurs fois le même contenu dans différents résultats. Seul moyen pour l'outil de recherche de lutter contre le phénomène de duplication : choisir une seule de ses sources. Ainsi, sur 20 pages ayant un contenu similaire, une seule sortira lors d'une requête. Les autres pages seront bien indexées par les moteurs, mais ne sortiront pas dans les résultats.

"Si on laisse le choix au moteur, ce ne sera pas forcément le bon", souligne Damien Selosse. Pourtant, dans la plupart des cas, un contenu dupliqué n'est pas volontaire. C'est sur ce point que réside la problématique du contenu dupliqué : il s'agit de le neutraliser.

Les points à contrôler comment généralement par les versions imprimables et les PDF des pages. De nombreux sites proposent ce type de pages, pensant qu'il s'agit d'une occasion supplémentaire pour augmenter ses positions. De manière générale, le moteur effectuera un choix et le risque est d'avoir des visiteurs sur la page "imprimez" où ne figure en général pas la publicité, ni le menu du site et les différentes rubriques, "un manque à gagner" , souligne Damiens Selosse.

"Il est préférable d'utiliser pour chacune l'extension domaine pour chaque pays et d'adapter son discours"
(Damien Selosse - Rouge Interactif)
En cas de contenu dédoublé, trois actions peuvent être mises en place : préciser la page sur le fichier "robot.txt" pour que le moteur ne l'indexe pas, mettre une règle "no follow" ou utiliser la redirection 301.

"Afin de clarifier et même si l'information semble évidente, un site en plusieurs langues n'est pas considéré comme une duplication", précise-t-il. Par contre, dans le cas de différentes versions dans une même langue - par exemple un site anglais, américain et australien - la question du duplicate content devient trouble. Faut-il ne proposer qu'un seul site ? "Il est préférable d'avoir différents versions, d'utiliser pour chacune l'extension domaine pour chaque pays et d'adapter le discours et les sites à chacune des cibles", conseille Damien Selosse.

Autre phénomène source de duplication : la syndication de contenu. Rentrant dans la case de "duplicate content", il ne s'agit pas de l'interdire, solution bien trop radicale pour le site qui perdrait une source de visiteurs et difficile à contrôler. En revanche, il est préférable de suivre de près les sites ayant repris certains contenus, vérifier que la source est citée avec un lien. "De plus, il faut s'arranger pour avoir un lien vers le site original dans le contenu repris. Ce qui permet de bien revendiquer au moteur la source de contenu", averti au passage le responsable génération trafic de l'agence Rouge Interactif.

Un travail doit également être mené sur les balises "titre" et "description". Bien souvent redondante, il est nécessaire de prendre du temps pour adapter les balises sur chaque page.

"Pour éviter le duplicate content, il faut dans un premier temps opérer un choix. Ensuite, il s'agit d'être constant dans ses choix et vérifier continuellement la mise en place de ses bonnes pratiques", résume Damien Selosse.

  En savoir plus
 Rouge Interactif
 Damien Selosse
Séminaire Benchmark Comment optimiser son site pour le référencement
Seule difficulté qui pourrait anéantir les efforts d'un site sur le contenu dupliqué : le Google washing. Faille découverte par la Dark SEO Team et qui utilise le filtre de duplicate content. David Degrelle, P-DG de l'agence 1ère Position, soulignait les effets de cette faille lors d'une enquête sur la disparition du site Armenager (lire l'enquête sur la disparition du site Armenager du 24/08/2006).

"Il est possible en utilisant le filtre de duplication de contenu et un jeu de redirection spécifique de déréférencer un site, c'est-à-dire de supprimer les pages dans l'index Google. C'est un bug, qui n'est toujours pas corrigé à ce jour, et qui - entre de mauvaises mains - peut avoir des conséquences dramatiques".

Emmeline RATIER, JDN Solutions Sommaire Moteur-Référencement
 
Accueil | Haut de page
 
 

  Nouvelles offres d'emploi   sur Emploi Center
Auralog - Tellmemore | Publicis Modem | L'Internaute / Journal du Net / Copainsdavant | Isobar | MEDIASTAY

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Voir un exemple

Toutes nos newsletters