« Contenu dupliqué » ou duplicate content est le terme utilisé quand un même type de contenu est accessible à plusieurs endroits sur internet. On appelle aussi contenu dupliqué toutes les pages qui sont accessibles via deux ou plusieurs URL différentes, car c’est l’URL qui est la base d’une page web.
D’ailleurs, la plupart des redacteurs de contenus ne se rendent même pas compte qu’ils produisent des contenus dupliqués, ce qui perturbe le SEO. Le duplicate content fait partie des problèmes les plus courants en SEO.
Quelles sont les causes qui amènent Google à considérer qu’un contenu est dupliqué et à pénaliser votre travail d’acquisition de visibilité et de trafic. Il est très important d’éviter le contenu dupliqué si vous voulez améliorer votre stratégie de référencement. Si vous êtes pénalisé par un algorithme de recherche, cela pourrait être dévastateur pour votre entreprise.
Certains propriétaires de sites Web copient et collent des articles entiers sans y réfléchir à deux fois, mais les experts de l’agence de référencement Orion Digital vont élucider le mystère de dupliquer le contenu et vous donner quelques conseils utiles qui vous aideront à éviter ce problème.
Définition de Google du contenu duplique :
« Dupliquer le contenu fait généralement référence à des blocs substantiels dans ou entre des domaines qui correspondent complètement à un autre contenu ou qui sont sensiblement similaires. »
Pourquoi le contenu dupliqué affecte-t-il le SEO ?
– Dans le cas où vous indexez le même contenu plusieurs fois, vous faites crawler plus que le nécessaire notre ami Google bot. Vous atteignez rapidement votre quota de pages crawlées par jour. Il est donc nécessaire de ne crawler que ce qui est vraiment important.
– Il est aussi possible que parmi les indexations sur un même contenu, Google fait le mauvais choix de ce qu’il va afficher dans les résultats. Du coup l’expérience utilisateur sera affectée.
On parle de Budget de crawl non optimisé : Google limite ses visites sur votre site pour optimiser ses ressources machines. C’est pour cela qu’il faut cacher les liens inutiles en les offusquant !
– Enfin, s’il est possible d’accéder à votre contenu avec plusieurs URL, il est fort probable que vous ayez moins de backlinks, car les internautes ne se sont pas tous atterris sur la même URL.
Definition du budget Crawl
Le Budget Crawl ou crawl budget est le nombre de pages que Googlebot va explorer sur un site web en tenant compte de plusieurs critères : taille du site, vitesse d’exploration, fréquence de mise à jour, qualité du contenu et nombre de clics.
Les 12 erreurs de contenu dupliqué les plus fréquentes
1* Indexer votre site avec et sans www
Si votre site reste accessible lorsque vous tapez votre URL comme http://www.exemple.com et aussi sans www, comme http://exemple.com, vous êtes exposé au risque de voir votre site indexé 2 fois par les moteurs de recherche.
Dans ce cas, vous avez du contenu dupliqué.
La solution est simple. Rediriger votre site vers le sous-domaine www. Vous devez donc rediriger l’URL http://exemple.com vers http://www.exemple.com.
Il est aussi possible de prendre l’inverse, de diriger votre site vers l’URL sans www.
De son côté, Google vous offre aussi la possibilité de déterminer vous-mêmes laquelle est la version officielle, également appelée « domaine favori » grâce à Google Search Console.
2* Avoir 2 URL pour une page d’accueil
La quasi-totalité des sites sur la toile a toute un lien qui pointe vers la page d’accueil.
Par exemple, si votre page d’accueil est index.php, tous les liens devront tous pointer vers http://www.exemple.com/, mais pas vers http://www.exemple.com/index.php.
Dans le cas contraire, il y a également un problème de contenu dupliqué, qui peut affecter vos backlinks et entrainer une dilution du PageRank.
Pour vous assurer qu’il n’y a pas de liens erronés ne pointant pas la bonne URL, vous pouvez opter pour la redirection 301 vers l’URL dite officielle ou aussi, écrire ces lignes de code PHP dans le fichier .htaccess ;
»
function redirection_301_si_besoin($uri_attendue)
{
if ($_SERVER[‘REQUEST_URI’] != $uri_attendue)
{
header(« Status: 301 Moved Permanently », false, 301);
header(« Location: http://www.example.com ».$uri_attendue);
exit;
}
} »
3* Avoir 2 URL pour la page 1 (pagination)
Vous avez par exemple un forum et vous limitez à 15 les messages sur chaque page. Vous utilisez aussi un système de pagination pour afficher les messages de la page numéro 2 et ainsi de suite. Normalement, toutes les pages ont une URL qui indique le numéro de la page et depuis la page 2 jusqu’à la page x, vous devrez avoir un lien qui pointe vers la page 1
Sur ce cas précis, vous devez absolument vérifier si ces liens pointent bien vers la bonne URL de la page 1.
C’est-à-dire, l’URL de la page par défaut du forum est ww.exemple.com/topic.php?t=456
Celui de la page 2 est www.exemple.com/topic.php?t=456&p=2
Alors, le lien qui doit pointer vers la page 1 depuis la page 2 devrait être www.exemple.com/topic.php?t=456, mais surtout pas www.exemple.com/topic.php?t=456&p=1
4* Avoir 2 types d’URL indexable (réécrites et classiques)
Prenons l’exemple précédent et supposons que vous venez de réécrire votre URL sur votre forum.
De ce fait, les URL de vos pages sont devenues www.exemple.com/topic-456.html.
De cette manière, vous interdisez toutes indexations des pages ayant l’URL www.exemple.com/topic.php?t=456.
La meilleure solution est alors de vous tourner vers la redirection 301 de vos anciennes URL vers votre nouveau format d’URL.
5 Problème de paramétrage CMS
Cette erreur arrive avec un CMS tel que WordPress ou Joomla.
Avec WordPress, il arrive fréquemment qu’un article soit disponible à plusieurs URL à cause des tags ou des catégories:
/monwordpress.com/macategory/monarticle/
/monwordpress.com/tags/monarticle/
/monwordpress.com/monarticle/
Faites très attention au paramétrage des permaliens de WordPress.
N’oubliez pas que les paramétrages automatiques conduisent a des duplications de balises.
6 Inclure seulement parfois des paramètres dans les URL
À l’instar d’un site multilingue disponible en français et en anglais, le paramètre lg de langue doit être intégré dans l’URL pour donner par exemple article.php?p=2534&lg=fr (pour la version française) et article.php?p=2534&lg=en (pour la version anglaise).
Dans le cas contraire, l’URL sera article.php ?p=2534 qui engendre du contenu dupliqué.
C’est pourquoi il est essentiel de toujours inclure ce paramètre dans l’URL.
7 Indexer la version imprimable
Celui-ci est aussi l’une des erreurs courantes, surtout sur un site ayant un article avec l’URL article.php ?p=2534 proposant une version imprimable sur article.php ?p=2534&print=1 . Le contenu de ces 2 URL est quasiment identique, ce qui peut amener à un contenu dupliqué.
Alors, il est conseillé d’utiliser les CSS pour définir une feuille de styles pour l’impression. Ainsi, vous n’avez pas besoin de générer une nouvelle URL.
8 Avoir une version PDF indexable
Similaire à un site proposant une version imprimable, un site qui propose un article avec l’URL article.php?p=2534 au format HTML et article-pdf.php?p=2534 au format PDF risque le même problème de contenu dupliqué.
Pour éviter tous désagréments, il est important de ne pas tenir compte de la version PDF. Et si vous avez déjà indexé les PDF, il faut que vous le désindexer en débloquant le crawl à Google.
9* Inclure la catégorie dans l’URL d’une fiche produit ou d’un article
Plusieurs personnes font l’erreur d’inclure la catégorie dans les fiches produits, pourtant, elle peut causer de différents problèmes. En effet, un nombre important de webmasters pensent que la mise en place des mots-clés dans l’URL est un des éléments les plus importants du référencement, ce qui n’est pas le cas bien sûr. En plus, cela vous oblige à reproduire dans votre URL la structure de l’arborescence de vos contenus.
Par ailleurs, il est aussi certain que vous êtes confronté à d’autres problèmes outre le contenu dupliqué surtout dans le cas où vous affecterez un article ou un produit à plusieurs catégories. Par exemple, lorsqu’une catégorie change de nom, son URL doit logiquement changer avec elle. Du coup, vous devrez changer toutes les URL dans l’arborescence. Il peut aussi y avoir une disparition de catégorie, deux ou plusieurs catégories qui se fusionnent ou une catégorie coupée en 2.
Alors, quel que soit votre site, il est fortement conseillé de ne pas mentionner dans l’URL de votre site des références à l’arborescence sauf si le contenu ne peut être associé qu’à une seule catégorie. (C’est valable pour WordPress)
Dans ce cas, vous pouvez placer la catégorie dans l’URL.
10* Avoir plusieurs noms de domaine indexés pour un même site
Dans le cas où vous avez acheté plusieurs noms de domaine pour votre site, ou que vous avez mis en place des redirections vers votre nom de domaine officiel, assurez-vous que tous ces noms de domaine secondaire ne sont crawle. Il est essentiel de le faire pour votre site qu’une seule fois.
Dans le cas contraire, veillez à ce tous ces domaines secondaires soient redirigés en 301 vers votre domaine principal.
11* Faire indexer le site en HTTP et en HTTPS
Si vous passez de HTTP à HTTPS, vous devrez vous assurer que tous se dirigent vers le HTTPS pour éviter le contenu dupliqué.
12* Faire indexer en desktop des URL du site mobile
Si vous venez de créer une version mobile de votre site pour ordinateur, par exemple en mettant comme sous-domaine m.exemple.com, veillez à ce que toutes vos URL mobiles aient leur équivalent sur le site pour desktop. Pour y remédier, Google vous propose d’utiliser une URL canonique.
13 Contenu dupliqué car le fournisseur fournit un contenu identique à ses clients drop shipping.
L’utilisation de contenu standard est une bonne chose car elle vous permet d’économiser du temps et de l’argent. Cependant, si vous envisagez de vendre votre propre produit, vous devriez plutôt envisager de créer une version du contenu original. Vous obtiendrez de meilleurs classements et des conversions plus élevées.
Si vous faites du drop shipping, par exemple, et que vous avez exactement un contenu identique sur votre site web que sur celui de votre fournisseur, Ali Baba, qui pensez-vous que Google va favoriser ? Il est donc important de rédiger un contenu unique sur votre site Web. Vous savez que cela prend du temps de personnaliser le contenu lorsque vous avez des centaines de produits, mais si vous ne le faites pas, cela peut vraiment aider votre classement dans les moteurs de recherche.
Contenu dupliqué pour engager sur les réseaux sociaux
De nombreuses personnes copient leur contenu pour le publier sur d’autres médias dans le cadre de leur stratégie numérique. Il s’agit de dupliquer du contenu de leurs articles de blog et de les publier sur les réseaux sociaux afin qu’ils puissent promouvoir leur contenu et augmenter le trafic sur leur site.
Si votre contenu est bon et intéressant, il attirera des lecteurs, mais il ne les convertira pas en clients. Les gens ne vont pas visiter votre site Web parce qu’ils savent déjà ce que vous proposez. Cependant, l’augmentation de vos conversions est certainement votre objectif ultime.
Vous pouvez utiliser ces méthodes pour promouvoir votre contenu sur différentes plateformes : ne publiez qu’une partie de votre article en guise d’accroche et créez un lien vers l’article complet ; utilisez les médias sociaux pour générer du trafic vers votre site ; et créez une infographie pour Pinterest.
Quels outils permettent de détecter une duplication de contenu ?
Des outils en ligne gratuits et payants sont à votre disposition.
- Vous pouvez utiliser Copy scape gratuitement, mais vous devrez vous inscrire pour obtenir de meilleurs résultats.
- Un siteliner, qui est un site web dédié à la recherche de contenu dupliqué, vous permet de savoir en un clic s’il existe un contenu similaire sur le web.
- Au sein de notre équipe nous utilisons Screaming Frog comme outil de référencement pour vérifier nos cocons sémantiques, le nombre de mots sur chaque page et le contenu dupliqué.
- PlagScan est disponible uniquement sur abonnement qui est très cher mais son plus grand avantage est qu’il analyse un grand texte en un seul passage.
- Que text propose deux versions, une gratuite et une pour 5 $ par mois. Nous avons testé l’option gratuite, et voici ce que nous en pensons :
- Gratuit.
- Rapide.
- Il est facile à utiliser
- Est capable de trouver du plagiat pur.
Conclusion
Le meilleur moyen pour éviter le contenu dupliqué est la redirection 301 il faut mettre à jour régulièrement votre site pour éliminer tous les liens qui pointent vers les mauvaises URL.
La plus importante, l’URL canonique est la solution universelle aux contenu dupliqué.
Existe-t-il une pénalité de contenu duplique ?
La duplication de contenu nuit à votre référencement naturel, Mais n’entraine aucune pénalité tant que vous n’avez pas volontairement copié le site Web de quelqu’un d’autre dans le but de tromper Google.
Si vous êtes honnête mais que vous rencontrez des soucis techniques vous n’avez pas à craindre de pénalité de Google. L’agence web Redaction Contenu Madagascar vous aide à produire du contenu web non dupliqués a verifier les erreurs de CMS
Bien que la duplication de contenu puisse nuire au référencement naturel en dispersant la valeur de lien et en créant de la confusion dans les résultats de recherche, Google n’impose pas de pénalités manuelles uniquement pour le contenu dupliqué, sauf dans des cas de manipulation flagrante destinée à tromper le moteur de recherche. L’utilisation de l’URL canonique et la redirection 301 sont des méthodes efficaces pour gérer le contenu dupliqué et consolider la réputation de certaines pages en dirigeant les utilisateurs et les moteurs de recherche vers la version préférée d’une page web.