contenu dupliqué

Comment éviter les erreurs de contenus dupliqués internes ?

« Contenu dupliqué » est le terme utilisé quand un même contenu est accessible à plusieurs endroits sur internet. On appelle aussi contenu dupliqué toutes pages qui sont accessibles via deux ou plusieurs URL différentes, car c’est l’URL qui est la base d’une page web.

D’ailleurs, la plupart des webmasters ne se rendent même pas compte qu’ils produisent du contenu dupliqué, ce qui apportera du poids négatif pour le SEO. Pourtant, Google affirme qu’il ne pénalise pas les sites qui ont du contenu dupliqué.

Pourquoi le contenu dupliqué affecte-t-il le SEO ?

– Dans le cas où vous indexez le même contenu plusieurs fois, vous faites crawler alors à Google un bon nombre de pages, plus que le nécessaire. Ainsi, vous atteignez rapidement votre quota de pages crawlées par jour. Il est donc nécessaire de ne crawler que ce qui est vraiment important.

– Il est aussi possible que parmi les indexations sur un même contenu, Google fait le mauvais choix de ce qu’il va afficher dans les résultats. Du coup, ce sera l’expérience utilisateur qui sera affectée.

– Enfin, s’il est possible d’accéder à votre contenu avec plusieurs URL, il est fort probable que vous ayez moins de backlinks, car les internautes ne se sont pas tous atterris sur la même URL. C’est pourquoi vous devez vous focaliser sur un seul endroit.

Les 12 erreurs de contenu dupliqué les plus fréquentes

contenu dupliqué1* Indexer votre site avec et sans www

Si votre site reste accessible lorsque vous tapez votre URL comme http://www.exemple.com et aussi sans www, comme http://exemple.com, vous êtes exposé au risque de voir votre site indexé 2 fois par les moteurs de recherche. Dans ce cas, vous êtes face à des soucis de contenu dupliqué.
La solution est simple. Éviter le contenu dupliqué avec et sans www. En d’autres termes, rediriger votre site vers le sous-domaine www. Vous devez donc rediriger l’URL http://exemple.com vers http://www.exemple.com.

Il est aussi possible de prendre l’inverse, de diriger votre site vers l’URL sans www.
De son côté, Google vous offre aussi la possibilité de déterminer vous-mêmes laquelle est la version officielle, également appelée « domaine favori » grâce à Google Search Console.

2* Avoir 2 URL pour votre page d’accueil

La quasi-totalité des sites sur la toile a toute un lien qui pointe vers la page d’accueil. Par ailleurs, il est nécessaire que vous vérifiiez que ce lien pointe la vraie URL de votre nom de domaine.
Par exemple, si votre page d’accueil est index.php, tous les liens devront tous pointer vers http://www.exemple.com/, mais pas vers http://www.exemple.com/index.php. Dans le cas contraire, il y a un problème de contenu dupliqué, qui peut affecter vos backlinks ou une dilution du PageRank.

Pour vous assurez qu’il n’y a pas de liens erronés ne pointant pas la bonne URL, vous pouvez opter pour la redirection 301 vers l’URL dite officielle ou aussi, écrire ces lignes de code PHP dans le fichier .htaccess
function redirection_301_si_besoin($uri_attendue)
{
if ($_SERVER[‘REQUEST_URI’] != $uri_attendue)
{
header(“Status: 301 Moved Permanently”, false, 301);
header(“Location: http://www.example.com”.$uri_attendue);
exit;
}
}

Il ne vous reste qu’à le personnaliser avec votre nom de domaine.
Dans cet exemple, on va nommer ce code fonctions.php.

Il est à noter que pour l’utiliser, vous devez obligatoirement le placer avant toute ligne HTML, et écrire comme ceci :

3* Avoir 2 URL pour la page 1 (pagination)

Vous avez par exemple un forum et vous limitez à 15 les messages sur chaque page. Vous utilisez aussi un système de pagination pour afficher les messages de la page numéro 2 et ainsi de suite. Normalement, toutes les pages ont une URL qui indique le numéro de la page et depuis la page 2 jusqu’à la page x, vous devrez avoir un lien qui pointe vers la page 1
Sur ce cas précis, vous devez absolument vérifier si ces liens pointent bien vers la bonne URL de la page 1.

C’est-à-dire, l’URL de la page par défaut du forum est ww.exemple.com/topic.php?t=456
Celui de la page 2 est www.exemple.com/topic.php?t=456&p=2
Alors, le lien qui doit pointer vers la page 1 depuis la page 2 devrait être www.exemple.com/topic.php?t=456, mais surtout pas www.exemple.com/topic.php?t=456&p=1

4* Avoir 2 types d’URL indexables (réécrites et classiques)

Prenons l’exemple précédent et supposons que vous venez de réécrire votre URL sur votre forum. De ce fait, les URL de vos pages sont devenues www.exemple.com/topic-456.html. De cette manière, vous interdisez toutes indexations des pages ayant l’URL www.exemple.com/topic.php?t=456.

La meilleure solution est alors de vous tourner vers la redirection 301 de vos anciennes URL vers votre nouveau format d’URL.

5* Ne pas toujours passer les paramètres d’URL dans le même ordre

Dans le cas où vous avez un site dynamique et que vous n’avez pas encore réécrit votre URL, il est possible que vos URL renferment des paramètres, comme viewtopic.php?

t=2534&postdays=0&postorder=asc&start=15. Dans ce cas, il est possible d’accéder à cette même page avec d’autres URL, comme viewtopic.php?t=2534&postorder=asc&postdays=0&start=15 ou viewtopic.php?postdays=0&postorder=asc&start=15&t=2534 .

Pour ceux qui ont déjà utilisé la réécriture d’URL savent très bien que dans le code, il est essentiel de centraliser la gestion de l’URL dans une fonction. De ce fait, il suffit d’utiliser la fonction pour générer un lien vers une page pour avoir le même format de lien.
Il est aussi à noter que cette méthodologie peut être appliquée sans réécriture d’URL.

6* Inclure seulement parfois des paramètres dans les URL

À l’instar d’un site multilingue disponible en français et en anglais, le paramètre lg de langue doit être intégré dans l’URL pour donner par exemple article.php?p=2534&lg=fr (pour la version française) et article.php?p=2534&lg=en (pour la version anglaise).

Dans le cas contraire, l’URL sera article.php ?p=2534 qui engendre du contenu dupliqué.
C’est pourquoi il est essentiel de toujours inclure ce paramètre dans l’URL.

7* Indexer la version imprimable

Celui-ci est aussi l’une des erreurs courantes, surtout sur un site ayant un article avec l’URL article.php ?p=2534 proposant une version imprimable sur article.php ?p=2534&print=1 . Le contenu de ces 2 URL est quasiment identique, ce qui peut amener à un contenu dupliqué.
Alors, il est conseillé d’utiliser les CSS pour définir une feuille de styles pour l’impression. Ainsi, vous n’avez pas besoin de générer une nouvelle URL.

8* Indexer la version PDF

Similaire à un site proposant une version imprimable, un site qui propose un article avec l’URL article.php?p=2534 au format HTML et article-pdf.php?p=2534 au format PDF risque le même problème de contenu dupliqué.

Pour éviter tous désagréments, il est important de ne pas indexer la version PDF. Et si vous avez déjà indexé les PDF, il faut que vous le désindexer en débloquant le crawl à Google.

9* Inclure la catégorie dans l’URL d’une fiche produit ou d’un article

Plusieurs personnes font encore cette erreur, pourtant, elle peut causer de différents problèmes.
En effet, un nombre important de webmasters pensent que la mise en place des mots-clés dans l’URL est un des éléments les plus importants du référencement, ce qui n’est pas le cas bien sûr. En plus, cela vous oblige à reproduire dans votre URL la structure de l’arborescence de vos contenus.

Par ailleurs, il est aussi certain que vous êtes confronté à d’autres problèmes outre le contenu dupliqué surtout dans le cas où vous affecterez un article ou un produit à plusieurs catégories.
Par exemple, lorsqu’une catégorie change de nom, son URL doit logiquement changer avec elle. Du coup, vous devrez changer toutes les URL dans l’arborescence.
Il peut aussi y avoir une disparition de catégorie, deux ou plusieurs catégories qui se fusionnent ou une catégorie coupée en 2.

Alors, quel que soit votre site, il est fortement conseillé de ne pas mentionner dans l’URL de votre site des références à l’arborescence sauf si le contenu ne peut être associé qu’à une seule catégorie. Dans ce cas, vous pouvez placer la catégorie dans l’URL.

10* Avoir plusieurs noms de domaine indexés pour un même site

Dans le cas où vous avez acheté plusieurs noms de domaine pour votre site, ou que vous avez mis en place des redirections vers votre nom de domaine officiel, assurez-vous que tous ces noms de domaine secondaire ne sont pas indexés. Pour cause, il est essentiel d’indexer votre site qu’une seule fois.

Dans le cas contraire, veillez à ce tous ces domaines secondaires soient redirigés en 301 vers votre domaine principal.

11* Faire indexer le site en HTTP et en HTTPS

Si vous passez de HTTP à HTTPS, vous devrez vous assurer que tous se dirigent vers le HTTPS pour éviter les problèmes de contenu dupliqué.

12* Faire indexer en desktop des URL du site mobile

Si vous venez de créer une version mobile de votre site pour ordinateur, par exemple en mettant comme sous-domaine m.exemple.com, veillez à ce que toutes vos URL mobiles aient leur équivalent sur le site pour desktop.
Pour y remédier, Google vous propose d’utiliser une URL canonique.

Conclusion

Le meilleur moyen aux problèmes de contenu dupliqué est la redirection 301. Ensuite, il est aussi important de mettre à jour régulièrement votre site pour éliminer tous les liens qui pointent vers les mauvaises URL.

La plus importante, l’URL canonique est la solution universelle aux problèmes de contenu dupliqué.

Posted in Rédaction and tagged , , , .

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *