Tout savoir sur le contenu dupliqué en SEO

La richesse d’internet en informations est sans nul doute son plus grand avantage. Toutefois, lorsque celle-ci est menacée par des doublons, l’on se retrouve avec une quantité pertinente d’informations qui diminue, au plus grand dam des moteurs de recherches et des internautes. Zoom sur une pratique à éviter à tout prix pour améliorer l’expérience utilisateur de votre site web.

Duplicate Content : Qu'est-ce que le duplicate content ?
Duplicate Content : Qu’est-ce que le duplicate content ?

Qu’est-ce que le contenu dupliqué ?

Le duplicate content qui nous vient de l’anglais fait référence à un contenu qui est identique ou similaire quand on compare deux sources d’informations. Dans le cas où celles-ci se différencient uniquement sur quelques points mineurs, on peut parler de quasi-duplicate. Lorsque cette pratique est répétée, on se retrouve avec plusieurs articles qui présentent le même contenu. Ce qui s’apparente plus à une forme de pollution numérique, qui va avoir des répercussions sur l’indexation des pages par les moteurs de recherche. Par incidence, ces derniers vont ruiner l’expérience des utilisateurs à la recherche d’informations utiles.

Pour trouver du duplicate content et le supprimer, il convient d’observer dans un premier temps ses différentes formes.

Le contenu dupliqué interne

Il est possible d’avoir sur différentes pages d’un site web, une information qui se répète plusieurs fois. Les boutiques en ligne font souvent l’objet de cette pratique, à cause de fiches produits ou de descriptions qui se répètent d’un produit à un autre. Cette situation peut aussi se produire pour des raisons de problèmes de configuration du site, d’erreurs humaines, et impactent l’indexation et le crawl des pages concernées.

Le contenu dupliqué externe

Contrairement au premier, le contenu dupliqué externe ne se retrouve que sur des sites tiers. On qualifie le plus souvent cette pratique de vol ou plagiat, puisque le contenu se retrouve utilisé ou légèrement modifié sans la permission de l’auteur initial. Toutefois, cet auteur peut aussi se servir en contenu sur des sites qui ne lui appartiennent pas, ce qui nous ramène au même résultat.

Pourquoi est-ce important d’éviter le contenu dupliqué ?

Il n’existe pas de bon duplicate content dans tous les cas. La pratique a toujours un impact négatif sur les moteurs de recherche, mais aussi sur le référencement naturel des sites web concernés, ce qui peut vous attirer des pénalités de diverses natures.

L’impact sur les moteurs de recherche et l’expérience utilisateur

Les moteurs de recherche permettent d’indexer le contenu présent sur internet afin de faciliter la recherche d’informations par un tiers. Lorsqu’ils trouvent deux contenus identiques, les moteurs ne savent plus quel contenu ils doivent indexer ou présenter à l’internaute qui effectue une recherche. Ce qui finit par compliquer leur travail et leur demander l’intervention de ressources externes humaines pour régler les conflits.

L’impact sur le référencement naturel

Grâce à des mises à jour successives, les moteurs de recherches se sont armés pour faire face au contenu dupliqué. Lorsqu’il le détecte par exemple, Google Panda tente de déterminer le site fautif afin de reléguer son contenu dans les résultats de recherche. Ce qui par incidence va impacter le trafic attiré par cette page.

Les différentes pénalités

Si l’enquête sur le duplicate content révèle une situation plus compliquée à résoudre, certaines pénalités manuelles peuvent être appliquées, allant du simple avertissement à la disparition du site dans l’index des moteurs de recherche. Bien qu’encore pratiqué par certains sites peu vertueux, ce dernier cas est toutefois rare.

En dernier lieu, la pénalité psychologique subie par les utilisateurs qui visitent votre site peut diminuer durablement votre trafic. En plus d’éviter vos pages pour de futures recherches, ces internautes vous feront de la mauvaise publicité, ce qui dans tous les cas va donner mauvaise réputation à votre site.

L'impact du contenu dupliqué en référencement naturel
L’impact du contenu dupliqué en référencement naturel

Le negative SEO

Bien que de nombreux moteurs de recherches refusent d’admettre son existence, le negative SEO consiste à nuire à un site en web en plagiant volontairement son contenu, puis en se faisant passer pour la source originelle de ce contenu afin de provoquer une pénalité pour l’auteur originel. Google ne s’exprimant pas sur ce sujet, le vrai fautif peut tout de même être sanctionné… si vous arrivez à prouver le tort.

Comment supprimer du contenu dupliqué ?

Vous l’avez compris, le contenu dupliqué n’est pas une pratique qui va améliorer la popularité de vos pages. Il convient donc de la limiter au maximum et de corriger les erreurs lorsqu’elles surviennent.

L’identification

Dans le processus de correction du duplicate content, vous devez commencer votre démarche par l’identification du contenu fautif. Dans ce cas de figure, l’outil Google Webmaster Tools peut vous indiquer si vous êtes victime d’une pénalité, ou s’il existe une copie de votre contenu sur un autre site. Dans le premier cas, il suffit de rectifier le contenu pour lever l’avertissement. Dans le deuxième cas, vous devrez déterminer si un site essaie de vous faire de la concurrence déloyale.

Pour ce faire, vous pouvez vous servir de plusieurs solutions pour analyser la teneur en duplicate content de votre site ou trouver le site fautif. Notez qu’une simple recherche sur Google suffit dans la plupart des cas pour retrouver la copie des informations que vous aviez postées sur vos pages.

La suppression

En ce qui concerne le duplicate content externe, vous pouvez faire attention au contenu migré lors des refontes de vos sites web. Évitez aussi les contenus indexés et les agrégateurs de plateformes. Une fois votre contenu retrouvé, vous pouvez rectifier le tir pour récupérer le trafic qui vous revient de droit. Toutefois, cette procédure peut s’avérer compliquée pour l’utilisateur lambda, qui ferait mieux de confier ce travail à un consultant SEO. Cette liste de conseils n’est pas exhaustive et peut s’enrichir d’autres procédures au besoin.

Dans le cadre d’une suppression de duplicate content interne, si vous avez quelques compétences dans le domaine, vous pouvez envisager les actions qui suivent :

  • Assigner une URL spécifique à chaque contenu ;
  • Éviter l’indexation de certains contenus ;
  • Utiliser la balise Canonical pour la répétition d’éléments ;
  • Évitez les bouts de codes qui se répètent en choisissant un thème optimisé ;
  • Indiquer le domaine par défaut de votre site.

Lire également ces articles en lien avec le contenu:
https://josselinleydier.com/seo/redaction-semantique/
https://josselinleydier.com/seo/champs-lexicaux-referencement/
https://josselinleydier.com/seo/outils-redaction-web/
https://josselinleydier.com/seo/referencement-recherche-vocale/
https://josselinleydier.com/seo/publier-regulierement-du-contenu/