Définition SEO

Duplicate content

"

Le duplicate content (contenu dupliqué) désigne des blocs de contenu identiques ou très similaires accessibles sur plusieurs URLs distinctes, au sein d'un même site ou entre différents sites. Il crée une confusion pour Google qui doit choisir quelle version indexer et positionner.

Quelles sont les causes courantes du duplicate content et comment y remédier ?

Le duplicate content crée un problème de dilution : Google répartit l’autorité entre plusieurs versions d’une même page au lieu de la concentrer sur une seule. Il n’y a généralement pas de pénalité directe sauf en cas de plagiat délibéré à grande échelle — le vrai risque est de voir aucune des versions bien positionnée.

Les causes les plus fréquentes : les paramètres d’URL (tracking, filtres, tri), les versions HTTP/HTTPS et www/non-www simultanément accessibles, la pagination, les pages de tags similaires sur les blogs, et les descriptions produits copiées depuis les fournisseurs sans modification.

Les solutions : balises canonical pour indiquer la version de référence, redirections 301 pour unifier les variantes, directives noindex sur les pages sans valeur ajoutée, et réécriture des contenus copiés pour les différencier sémantiquement.

Exemple concret

Un site accessible en HTTP et HTTPS, avec et sans www, expose potentiellement chaque page en 4 variantes d’URLs. Google peut indexer des versions différentes selon les pages, répartissant les backlinks entre ces variantes. Une simple redirection 301 de toutes les variantes vers l’URL canonique HTTPS résout ce problème courant et souvent sous-estimé.

FAQ — Duplicate content

Vous avez un projet SEO ?

Mettons ce savoir en pratique pour votre site.