LOT III G 63H

Antananarivo 101

voice_assistant

+33 7 57 95 37 31
+261 34 96 496 95

Customer Support

time management

Lun - Ven 9:00 - 18:30

Horaire

Eviter les 12 erreurs de contenus dupliqués les plus courantes

contenus dupliqués ou duplicate content

« Contenus dupliqués » ou duplicate content est le terme utilisé quand un même contenu est accessible à plusieurs endroits sur internet.

On appelle aussi contenu dupliqué toutes les  pages qui sont accessibles via deux ou plusieurs URL différentes, car c’est l’URL qui est la base d’une page web.

D’ailleurs, la plupart des webmasters ne se rendent même pas compte qu’ils produisent des contenus dupliqués, ce qui perturbe le SEO. Le duplicate content fait partie des problèmes les plus courants en SEO.

Quelles sont les causes qui amènent Google à considérer qu’un contenu est dupliqué et a pénaliser votre travail d’acquisition de visibilité et de trafic

Définition de Google du contenu duplique :

« Dupliquer le contenu fait généralement référence à des blocs substantiels dans ou entre des domaines qui correspondent complètement à un autre contenu ou qui sont sensiblement similaires. »

Pourquoi le contenu dupliqué affecte-t-il le SEO ?

– Dans le cas où vous indexez le même contenu plusieurs fois, vous faites crawler plus que le nécessaire notre ami Google bot. Vous atteignez rapidement votre quota de pages crawlées par jour. Il est donc nécessaire de ne crawler que ce qui est vraiment important.

– Il est aussi possible que parmi les indexations sur un même contenu, Google fait le mauvais choix de ce qu’il va afficher dans les résultats. Du coup l’expérience utilisateur sera affectée.

On parle de  Budget de crawl non optimisé : Google limite ses visites sur votre site pour optimiser ses ressources machines. C’est pour cela qu’il faut cacher les liens inutiles en les offusquant !

– Enfin, s’il est possible d’accéder à votre contenu avec plusieurs URL, il est fort probable que vous ayez moins de backlinks, car les internautes ne se sont pas tous atterris sur la même URL.

Definition du budget Crawl

Le Budget Crawl ou crawl budget est le nombre de pages que Googlebot va explorer sur un site web en tenant compte de plusieurs critères : taille du site, vitesse d’exploration, fréquence de mise à jour, qualité du contenu et nombre de clics.

Les 12 erreurs de contenu dupliqué les plus fréquentes

contenu dupliqué ou duplicate content
Des contenus dupliqués en trop grand nombre peuvent gaspiller le budget crawl de votre site

1* Indexer votre site avec et sans www

Si votre site reste accessible lorsque vous tapez votre URL comme http://www.exemple.com et aussi sans www, comme http://exemple.com, vous êtes exposé au risque de voir votre site indexé 2 fois par les moteurs de recherche.

Dans ce cas, vous avez du contenu dupliqué.

La solution est simple. Rediriger votre site vers le sous-domaine www. Vous devez donc rediriger l’URL http://exemple.com vers http://www.exemple.com.

Il est aussi possible de prendre l’inverse, de diriger votre site vers l’URL sans www.
De son côté, Google vous offre aussi la possibilité de déterminer vous-mêmes laquelle est la version officielle, également appelée « domaine favori » grâce à Google Search Console.

2* Avoir 2 URL pour une page d’accueil

La quasi-totalité des sites sur la toile a toute un lien qui pointe vers la page d’accueil.
Par exemple, si votre page d’accueil est index.php, tous les liens devront tous pointer vers http://www.exemple.com/, mais pas vers http://www.exemple.com/index.php.

Dans le cas contraire, il y a également un problème de contenu dupliqué, qui peut affecter vos backlinks et entrainer une dilution du PageRank.

Pour vous assurer qu’il n’y a pas de liens erronés ne pointant pas la bonne URL, vous pouvez opter pour la redirection 301 vers l’URL dite officielle ou aussi, écrire ces lignes de code PHP dans le fichier .htaccess ;

 »
function redirection_301_si_besoin($uri_attendue)
{
if ($_SERVER[‘REQUEST_URI’] != $uri_attendue)
{
header(« Status: 301 Moved Permanently », false, 301);
header(« Location: http://www.example.com ».$uri_attendue);
exit;
}
} »

3* Avoir 2 URL pour la page 1 (pagination)

Vous avez par exemple un forum et vous limitez à 15 les messages sur chaque page. Vous utilisez aussi un système de pagination pour afficher les messages de la page numéro 2 et ainsi de suite. Normalement, toutes les pages ont une URL qui indique le numéro de la page et depuis la page 2 jusqu’à la page x, vous devrez avoir un lien qui pointe vers la page 1
Sur ce cas précis, vous devez absolument vérifier si ces liens pointent bien vers la bonne URL de la page 1.

C’est-à-dire, l’URL de la page par défaut du forum est ww.exemple.com/topic.php?t=456
Celui de la page 2 est www.exemple.com/topic.php?t=456&p=2
Alors, le lien qui doit pointer vers la page 1 depuis la page 2 devrait être www.exemple.com/topic.php?t=456, mais surtout pas www.exemple.com/topic.php?t=456&p=1

4* Avoir 2 types d’URL indexables (réécrites et classiques)

Prenons l’exemple précédent et supposons que vous venez de réécrire votre URL sur votre forum.

De ce fait, les URL de vos pages sont devenues www.exemple.com/topic-456.html.

De cette manière, vous interdisez toutes indexations des pages ayant l’URL www.exemple.com/topic.php?t=456.

La meilleure solution est alors de vous tourner vers la redirection 301 de vos anciennes URL vers votre nouveau format d’URL.

5*Probleme de parametrage CMS

Cette erreur arrive avec un CMS tel que WordPress ou Joomla.

Avec wordpress, il arrive fréquemment qu’un article soit disponible à plusieurs URL à cause des tags ou des catégories:

/monwordpress.com/macategory/monarticle/

/monwordpress.com/tags/monarticle/

/monwordpress.com/monarticle/

Faites très attention au paramétrage des permaliens de WordPress.

N’oubliez pas que les paramétrages automatiques conduisent a des duplications de balises.

6* Inclure seulement parfois des paramètres dans les URL

À l’instar d’un site multilingue disponible en français et en anglais, le paramètre lg de langue doit être intégré dans l’URL pour donner par exemple article.php?p=2534&lg=fr (pour la version française) et article.php?p=2534&lg=en (pour la version anglaise).

Dans le cas contraire, l’URL sera article.php ?p=2534 qui engendre du contenu dupliqué.
C’est pourquoi il est essentiel de toujours inclure ce paramètre dans l’URL.

7* Indexer la version imprimable

Celui-ci est aussi l’une des erreurs courantes, surtout sur un site ayant un article avec l’URL article.php ?p=2534 proposant une version imprimable sur article.php ?p=2534&print=1 . Le contenu de ces 2 URL est quasiment identique, ce qui peut amener à un contenu dupliqué.
Alors, il est conseillé d’utiliser les CSS pour définir une feuille de styles pour l’impression. Ainsi, vous n’avez pas besoin de générer une nouvelle URL.

8* Indexer la version PDF

Similaire à un site proposant une version imprimable, un site qui propose un article avec l’URL article.php?p=2534 au format HTML et article-pdf.php?p=2534 au format PDF risque le même problème de contenu dupliqué.

Pour éviter tous désagréments, il est important de ne pas indexer la version PDF. Et si vous avez déjà indexé les PDF, il faut que vous le désindexer en débloquant le crawl à Google.

9* Inclure la catégorie dans l’URL d’une fiche produit ou d’un article

Plusieurs personnes font l’erreur d’inclure la catégorie dans les fiches produits, pourtant, elle peut causer de différents problèmes.
En effet, un nombre important de webmasters pensent que la mise en place des mots-clés dans l’URL est un des éléments les plus importants du référencement, ce qui n’est pas le cas bien sûr. En plus, cela vous oblige à reproduire dans votre URL la structure de l’arborescence de vos contenus.

Par ailleurs, il est aussi certain que vous êtes confronté à d’autres problèmes outre le contenu dupliqué surtout dans le cas où vous affecterez un article ou un produit à plusieurs catégories.
Par exemple, lorsqu’une catégorie change de nom, son URL doit logiquement changer avec elle. Du coup, vous devrez changer toutes les URL dans l’arborescence.
Il peut aussi y avoir une disparition de catégorie, deux ou plusieurs catégories qui se fusionnent ou une catégorie coupée en 2.

Alors, quel que soit votre site, il est fortement conseillé de ne pas mentionner dans l’URL de votre site des références à l’arborescence sauf si le contenu ne peut être associé qu’à une seule catégorie. (C’est valable pour WordPress)

Dans ce cas, vous pouvez placer la catégorie dans l’URL.

10* Avoir plusieurs noms de domaine indexés pour un même site

Dans le cas où vous avez acheté plusieurs noms de domaine pour votre site, ou que vous avez mis en place des redirections vers votre nom de domaine officiel, assurez-vous que tous ces noms de domaine secondaire ne sont pas indexés. Pour cause, il est essentiel d’indexer votre site qu’une seule fois.

Dans le cas contraire, veillez à ce tous ces domaines secondaires soient redirigés en 301 vers votre domaine principal.

11* Faire indexer le site en HTTP et en HTTPS

Si vous passez de HTTP à HTTPS, vous devrez vous assurer que tous se dirigent vers le HTTPS pour éviter les problèmes de contenu dupliqué.

12* Faire indexer en desktop des URL du site mobile

Si vous venez de créer une version mobile de votre site pour ordinateur, par exemple en mettant comme sous-domaine m.exemple.com, veillez à ce que toutes vos URL mobiles aient leur équivalent sur le site pour desktop.
Pour y remédier, Google vous propose d’utiliser une URL canonique.

Conclusion

Le meilleur moyen aux problèmes de contenu dupliqué est la redirection 301. Ensuite, il est aussi important de mettre à jour régulièrement votre site pour éliminer tous les liens qui pointent vers les mauvaises URL.

La plus importante, l’URL canonique est la solution universelle aux problèmes de contenu dupliqué.

Existe-t-il une pénalité de contenu duplique ?

La duplication de contenu nuit à votre référencement naturel, Mais n’entraine aucune pénalité tant que vous n’avez pas volontairement copié le site Web de quelqu’un d’autre dans le but de tromper Google.

Si vous êtes honnête mais que vous rencontrez des soucis techniques vous n’avez pas à craindre de pénalité de Google .Redaction Contenu Madagascar vous aide a produire du contenu web non dupliquée a verifier les erreurs de CMS

PIERRE LUC GERVAIS

PIERRE LUC GERVAIS

Ingénieur EEA, Pierre-Luc GERVAIS a débuté en SSI chez Transiciel . Consultant SI pour de grands groupes Télécom ou bancaire (Cegetel, SFR, Euronext). Fin 1990 Carriere aux USA dans la logistique (UPS) et l’industrie automobile (Toyota), CRM). Après une mission au sein d’une NGO en 2005 à Madagascar, PLG a fondé une agence digitale en externalisation à Madagascar en 2008 Orion digital a adopté une démarche Inbound Marketing et est donc un partenaire de choix pour externaliser en toute sécurité votre transformation digitale. Nous sommes HubSpot Partner depuis 2018.

Leave a Replay

référencement naturel

REMPLISSEZ CE FORMULAIRE ON S’OCCUPE DE VOTRE MARKETING DIGITAL

Partager sur facebook
Partager sur twitter
Partager sur linkedin
Partager sur pinterest
Partager sur whatsapp

Articles recents

Suivez Nous

Video de la semaine

Inscrivez vous a notre newsletter

Nous ne spammerons pas votre email