Je vérifie que mon contenu n’est pas dupliqué

Contenu dupliqué

Pour bénéficier d’un meilleur positionnement sur les SERPs, les sites doivent être conçus dans le respect des normes et contraintes en vigueur en matière de référencement SEO. En effet, la pertinence et l’originalité des contenus font partie des principaux critères qu’il faudra absolument prendre en considération si on veut qu’une plateforme puisse apparaître en tête des résultats organiques. De plus, le fait est que ces deux caractéristiques déterminent considérablement la qualité des supports proposés aux internautes. Le contenu dupliqué est à bannir définitivement de votre stratégie SEO.

Pour s’assurer que vous respectez leurs règles, les moteurs de recherche utilisent des algorithmes qui leur permettent de détecter les anomalies et mauvaises pratiques et de sanctionner systématiquement, en conséquence, les sites concernés.Et, le contenu dupliqué fait partie des actions fortement prohibées. Mais alors, en quoi le duplicate content constitue-t-il un véritable danger pour les sites ? Et comment s’assurer que les contenus que l’on propose sur le web soient réellement uniques ?

Duplicate content, la définition

Le concept de contenu dupliqué part du principe que l’indexation SEO détecte la présence de plusieurs contenus similaires accessibles sur des urls différentes. C’est, par exemple, le cas si un même texte se retrouve sur plusieurs pages d’un même site ou de deux plateformes différentes. Dans le premier cas, l’erreur peut être involontaire. De fait, certains incidents techniques au niveau du CMS utilisé peuvent en être la cause, mais le problème peut aussi provenir d’une simple erreur de content marketing.

Dans le second cas, on peut pratiquement parler de plagiat puisqu’on peut considérer qu’il s’agit d’un vol de contenu. Effectivement, certains sites peu scrupuleux utilisent ce genre de pratique « black hat » pour pénaliser leurs concurrents. Quoi qu’il en soit, Google détecte toujours le duplicate content. Et, cela engendrera de sérieuses répercussions sur le positionnement SEO des sites concernés.

Que considère-t-on comme un contenu plagié?

Le système de repérage des contenus dupliqués peut éventuellement varier d’un moteur de recherche à un autre. Mais, sur Google, l’algorithme se base principalement sur le signalement d’un même contenu présent sur des urls différentes. Alors, Google peut déceler un contenu dupliqué sur une même plateforme ou sur des sources différentes. Cela peut être des textes, des images, des vidéos ou même des logos.

Sur un même site, le problème peut venir d’une cohabitation entre les anciennes et les nouvelles urls suite à une restructuration ou tout simplement d’un dysfonctionnement technique. Dans le cas des contenus identiques décelés sur des supports différents, ce sont surtout les sites e-commerce que Google impacte le plus quand ils reprennent les descriptions déjà utilisées par leurs concurrents ou quand celles-ci sont trop identiques. Il peut également arriver que l’incident soit causé par des flux RSS qui ont été récupérés au format XML. La pratique la plus évidente sera toujours la reprise volontaire (plagiat) d’une partie ou de l’intégralité d’un contenu existant. Alors, on parle de contenu plagié.

Bien sûr, on ne peut pas créer de nouveaux mots ou expressions au risque de rendre un contenu incompréhensible. C’est pour cette raison que Google applique un niveau de tolérance afin de s’assurer de l’originalité et l’authenticité des éléments. Il tolère un similarité inférieure à 30%. Mais, dans l’idéal, vous devez veiller à ce pourcentage soit réduit autant que possible.

J’ai dupliqué du contenu à mon insu !

Comme on l’a déjà vu précédemment, il se peut que l’on ait fait du duplicate content sans vraiment le savoir. De plus, certains sites le font même en croyant bien faire. Le cas le plus répandu est celui des fiches-produits et fiches descriptives. Par exemple, sur les sites spécialisés dans la vente en ligne, les professionnels préfèrent souvent reprendre le descriptif (étiquette, notice, conseils d’utilisation et autres) présenté par le fabricant ou le fournisseur afin d’éviter tout malentendu. Le problème survient alors quand les mêmes produits ou articles sont vendus sur d’autres plateformes. Certes, la pratique est involontaire, mais le moteur de recherche prend en compte la duplication . Et, pour trancher, ce dernier décidera de privilégier le site le plus populaire ou celui qui dispose du contenu le plus ancien.

En quoi c’est grave pour le SEO ?

Google considère le contenu dupliqué, rappelons-le, comme étant une pratique « black hat ». Cela signifie qu’elle ne respecte pas les règles établies qui régissent l’univers des SERPs et du référencement naturel. Les géants comme Google pénalisent fortement cette transgression dans la mesure où elle fait perdre un temps précieux au robot d’indexation. Sans oublier que Google va enregistrer les articles ou éléments similaires dans sa base de données et, donc, réduire leur capacité de stockage.

En outre, puisque l’internaute n’aura pas vraiment besoin de voir des résultats similaires, les spécialistes considèrent qu’en endiguant le problème, ils favorisent l’aspect « pertinence ». Concrètement, la pénalité se constatera à travers le positionnement des plateformes. Les sites condamnés pour plagiat ou duplicate content subiront un déclassement systématique (chute de positionnement). Dans le pire des cas, les conséquences vont bien au-delà d’une simple rétrogradation puisque les plateformes peuvent pratiquement disparaître des pages de résultats.

Vol de contenu, les risques du plagiat

Le plagiat est perçu comme une duplication intentionnelle. De fait, juridiquement, la pratique est synonyme de vol de contenu ou de pillage des œuvres d’autrui. Elle est donc illégale. Et, les victimes de ce genre de préjudice peuvent recourir à la justice en déposant une plainte pour atteinte au droit d’auteur. Il est toutefois à noter que cette démarche est une lame à double tranchant. En effet, s’il s’avère qu’il s’agit d’une fausse déclaration, le plaignant sera amené à payer de lourds dommages et intérêts (pour plus d’informations sur les réglementations concernant le plagiat, se référer au support proposé par Google).

Comment vérifier si vous avez dupliqué un contenu ?

La manière la plus simple de s’assurer que l’on n’est pas concerné par un cas de duplicate content sera toujours de vérifier que les contenus mis en ligne soient uniques et assurément originaux. Pour ce faire, différents outils sont actuellement disponibles. Pour les webmasters ou référenceurs, la section Amélioration HTML du Google Search Console permet de déceler les balises title ou meta-descriptions dupliquées. Mais, s’il s’agit de détecter le niveau de similarité d’un article par rapport aux éventuelles sources déjà présentes sur la toile, d’autres outils spécifiques (gratuits et payants) seront plus efficaces.