Qu’est-ce que le duplicate content, aussi appelé contenu dupliqué ou contenu plagié ? Ces appellations désignent toutes la même chose : copier mot pour mot des contenus existants sur le web. Ce sont donc des contenus identiques retrouvés des sites différents, aussi bien que sur des pages différentes d’un même site. Quelles sont les règles du jeu émises par Google au sujet des différentes formes de duplicate content ? Qu’est-ce que cela implique d’un point de vue SEO ? Trouvez ici tout ce que vous devez savoir sur le duplicate content, ses différentes formes et les conséquences que cette pratique interdite peut entrainer.

Définition du duplicate content

La notion de contenu dupliqué est très présente dans les thématiques du référencement naturel SEO en général et dans la production de contenu en particulier. Les règlementations de Google à ce sujet sont précises, mais les interprétations des recommandations sont parfois obsolètes, voire erronées.

Pour bien saisir la logique de Google à ce sujet, voici la définition exacte des différentes formes de duplicate content. Le contenu dupliqué désigne un contenu identique, existant sur différentes pages web, que cela soit au sein du même site internet aussi bien que sur des sites différents. Les robots de Google peuvent identifier des pages entières, mais également des petites sections de textes ou des paragraphes. L’objectif visé par Google est d’assurer autant que possible la qualité des contenus. Or, le contenu unique, original, reste un gage certain de qualité.

Contenu dupliqué externe ou interne : même combat

Le duplicate content externe concerne des contenus similaires sur des plateformes distinctes. cela peut concerner des pages entières copiées mot pour mot, ou des passages plus restreints.

Le duplicate content interne, quant à lui, n’est pas forcément mal attentionné, mais intrinsèque à la nature du site. Les plateformes de e-commerce sont notamment concernées par le duplicate interne.  Une contrainte non négligeable quand il s’agit de produire un volume important de fiches produits qui peuvent avoir le même descriptif.

Qu’elle soit interne ou externe, la duplication de contenu peut avoir des conséquences négatives sur les performances de votre site.

Les trois différentes formes du contenu dupliqué

  • Les pages identiques : textes, images, sous-titres et structures similaires. Les sites miroirs sont particulièrement concernés par cette forme de duplicate content.
  • Les pages identiques avec balises titres et descriptions différentes.
  • Les pages différents contenant les mêmes balises titres et la même description.

Les conséquences négatives du duplicate content

Les moteurs de Google veillent, crawlent, analysent les contenus des sites en permanence. Les sites ayant recours au plagiat en proportion importante, risquent la désindexation pure et simple de leur site, c’est-à-dire qu’ils n’apparaitront plus dans la SERP. Ceci dans le but de toujours améliorer l’expérience utilisateur, par la qualité et la pertinence des résultats de recherches.

La sanction de la désindexation concerne spécifiquement les sites ayant recours au plagiat, en s’appropriant un contenu existant, de façon mal attentionnée. Néanmoins, il faut avoir conscience que tous les cas de figure, le duplicate content aura des influences négatives sur votre site. Les répercussions se feront essentiellement ressentir sur les résultats de trafic, puisque seuls les contenus originaux seront favorisés, avec une meilleure visibilité sur la SERP. C’est-à-dire que seule la page identifiée et analysée comme étant à l’origine du contenu sera favorisée au niveau de son référencement.

Comment éviter le duplicate content

Des rédacteurs web spécialisés SEO

Créer un contenu original et unique reste la manière la plus efficace de se prémunir des risques du duplicate content. Ainsi, les textes publiés doivent être motivés par la valeur ajoutée apportée à l’internaute. Dans le cadre des sites d’e-commerce, avec une problématique de duplicate interne (par exemple, des fiches produits ayant des descriptions similaires) ; la mise en place d’une stratégie éditoriale peut être salutaire. Méthodes de rédaction SEO,  et actions techniques au niveau du code, sont des solutions efficaces et pérennes.

Bénéficier d’un contenu unique et original

Des outils pour détecter les contenus dupliqués

Il existe des outils efficaces, dont certains gratuits et simples d’utilisation qui peuvent vous aider à identifier les contenus dupliqués. Pour répondre à des problématiques de duplicate interne, Screaming frog et Siteliner sont des crawlers très efficaces. Ces outils analysent toutes les pages et identifient précisément les URL, les métadescriptions, les titres de pages dupliqués. Siteliner est plus indiqué pour les sites de grandes envergures, comme les plateformes e-commerce.

Pour répondre à des questions de duplicate externe, Kill duplicate permet de détecter en temps réel les sites plagiaires. Autre outil, Duplichecker : il permet d’un simple copier-coller de votre texte, d’avoir des indications fiables sur l’originalité de votre contenu.