Je vérifie si je n’ai pas des pages inutiles qui sont indexées par Google

Pages inutiles

Le nombre de pages est une caractéristique SEO importante qui peut jouer en faveur ou en défaveur d’un site. Normalement, pour étoffer et enrichir le contenu disponible en ligne, on a tendance à miser sur la quantité quand on parle de cet aspect en particulier. Toutefois, quand on sait que trouver le bon équilibre est la véritable bonne pratique à adopter, on se rend compte très rapidement que certaines pages inutiles seo indexées peuvent être inutiles et ne font qu’alourdir la structure d’une plateforme.

Bien sûr, pour les webmasters et référenceurs, le secret est avant tout de savoir jouer sur le concept de silo et celui de la distribution de Pagerank afin de déterminer le nombre de pages idéal permettant d’optimiser un site. Cependant, comme les professionnels le savent, il arrive que les sources inutiles indexées découlent de la conception du site elle-même. La question se pose alors : comment détecter et gérer ces pages parasites ?

Pages inutiles, la définition

Le principe des moteurs de recherche étant d’apporter des réponses pertinentes aux requêtes des internautes, toute source superflue sera considérée comme inutile. Techniquement, du côté des spécialistes du référencement naturel, cela se traduit par : toute page qui accumule trop de Pagerank alors qu’elle ne vise aucune requête SEO est jugée non voulue. Que ce soit sur un site e-commerce, sur un site vitrine, un blog, ou un site d’entreprise, ces supports parasites peuvent être de différentes natures. Pages panier, pages de média, tags, sections « mentions légales » et autres, ces éléments paraissent anodins, mais le fait qu’ils soient indexés peut avoir de sérieux impacts sur le positionnement d’une plateforme. Une refonte de site web génère souvent des pages inutiles SEO.

Que considère-t-on réellement comme une page inutile ?

Selon les experts SEO, les pages considérées comme inutiles, mais qui sont normalement indexées sans un ajustement technique peuvent varier en fonction du CMS (systèmes de gestion de contenu) utilisé. Sur les outils très répandus comme WordPress, ces sources parasites ou non voulues peuvent être :

Des contenus par défaut

Les catégories et pages automatiques (« non classé », « exemple » et « Bonjour tout le monde ») qui se créent quand on installe WordPress n’ont en réalité aucune utilité, mais sont automatiquement indexées.

Dues à des étiquettes ou tags

Considérées à tort comme étant des hashtags, les étiquettes peuvent engendrer de pages vides. Cette mauvaise pratique aura pour effet d’alourdir la structure du site, et même de créer des contenus dupliqués.

Des pages cachées des plugins

Qu’on ait conçu un magnifique slider pour qu’il figure sur la page d’accueil d’un site peut paraître une bonne chose. Cependant, cet élément fonctionne en principe en créant une URL qui contient juste une image et donc une page pratiquement vide. Le problème devient assez grave sur les sites où de nombreux sliders ont été créés.

Des « attachment pages »

Normalement, une image chargée, sans ajustement technique, devrait rediriger automatiquement vers une URL. Les pages engendrées suite à ce fonctionnement automatique sont appelées des « attachment pages » et n’ont pratiquement aucune utilité.

Des commentaires

La présence d’une section commentaire est tout à fait normale sur un site. Toutefois, sur WordPress, un mauvais réglage de cette fonctionnalité entraînera la création de pages de commentaires non voulues qui peuvent aussi engendrer de nombreuses duplications. En outre, une configuration non appropriée peut aussi favoriser les spams.

La pagination sur la page d’accueil

C’est assez rare, mais il arrive qu’une pagination dans le header du site renvoie sur une page erreur 404 ou une copie intégrale de la page d’accueil. Cette source est inutile, mais sera indexée sans un réglage adapté.

Des contenus dupliqués

Sur WordPress, il se peut que l’on fasse du duplicate content à son insu à cause des pages « auteurs » et les archives par date. Le fait est qu’à chaque article publié, le CMS crée une copie dans la page où tous les articles écrits sont listés et une autre qui affiche les réalisations mensuelles. Cette fonction est pratique pour les plateformes qui font intervenir plusieurs auteurs. Cependant avec un site qui n’utilise qu’un seul auteur et qui n’affiche qu’une seule catégorie, cela ne fera qu’engendrer des contenus dupliqués.

Comment connaître le nombre de pages indexées sur mon site ?

Pour évaluer le nombre de pages indexées sur un site, les professionnels ont trois solutions. La première consistera à utiliser la requête de recherche avec la commande « site: » et le nom du domaine. Cette méthode donne un rapide aperçu du nombre de sources indexées. Il est, par ailleurs, possible d’affiner la recherche en indiquant diverses options comme les sous-répertoires, les expressions-clés et autres. La deuxième option concerne l’outil Google Search Console (section « Google index » et sous-menu « Statut d’index »). Ce support, destiné aux webmasters et référenceurs, permet d’obtenir un résultat précis. La dernière solution sera toujours de recourir aux outils d’analyse SEO (gratuits ou payants) proposés en ligne.

Que faire des pages inutiles ?

En général, les pages inutiles doivent être supprimées ou désindexées afin d’optimiser le site. Mais la meilleure pratique consistera tout d’abord à réaliser les bons réglages au niveau du CMS afin d’éviter les erreurs ou problèmes techniques qui peuvent être à l’origine de ces sources non voulues.

Comment rendre des pages invisibles par Google ?

Bien sûr, il se peut que certaines pages telles que les CGV, les mentions légales et autres soient inhérentes à la structure du site, mais n’ont pas réellement besoin d’être indexées. Dans ce cas-ci, la désindexation sera la solution la plus recommandée. Pour ce faire, les professionnels peuvent utiliser la ligne du Disallow du robots.txt et, ainsi, exclure une URL du site (ou un répertoire entier) de l’indexation seo. Bien sûr, cette approche nécessite une connaissance technique en matière de développement web puisqu’elle touche directement les lignes de code et certificat ssl.

L’autre option sera de recourir à la balise « noindex » pour ceux qui utilisent le CMS WordPress. L’URL sera suivie, mais elle ne sera pas indexée. La dernière méthode, elle, se porte sur la section « Index Google » de l’outil Google Webmaster Tools. Dans l’onglet « urls à supprimer », il existe une option permettant aux professionnels de demander à Google de ne plus indexer une ou plusieurs pages.

Comment détecter des pages inutiles ?

La meilleure façon de repérer les pages inutiles présentes sur une plateforme sera toujours d’effectuer un audit SEO du site en question. Outre la détection des pages non voulues, cette approche va aussi servir à évaluer l’état de la plateforme en général et ainsi de corriger les erreurs et les problèmes techniques. Toutefois, s’il s’agit tout simplement de déceler les sources parasites, l’indexation globale devrait permettre d’analyser les pages « indexables » et les pages « non indexables ».