Bloquer l’indexation des espaces de préprod sur Google
Lors de la création ou de la refonte d’un site internet, beaucoup d’entreprises commettent l’erreur de laisser les robots d’indexation de Google explorer leur espace de développement. C’est une mauvaise pratique qu’il faut éviter à tout prix. Pourquoi et comment bloquer cette indexation ? Découvrez dans cet article tout ce qu’il faut savoir sur la protection de l’environnement de développement (préprod).

Pourquoi éviter l’indexation d’un site en développement ?
En quoi est-ce problématique ? C’est la question qui revient le plus souvent lorsque je sensibilise mes clients sur l’importance de ne pas laisser Google indexer un site en pleine refonte. En effet, lors de la conception d’un site, on a souvent tendance à y mettre du contenu (texte) choisi au hasard, des placeholders, etc. Il peut s’agir d’un contenu de piètre qualité ou de textes qui n’ont aucun rapport avec la thématique qui sera abordée après le lancement de la plateforme.
Cependant, lorsque l’algorithme de Google accède à l’espace de développement, il considère tout ce qu’il y trouve comme étant du contenu final et l’indexe tel quel. Ainsi, si le contenu temporaire était tiré d’un autre site (même s’il vous appartient), le moteur de recherche considérera cela comme un duplicate content. La réputation de votre nom de domaine en prendra un coup.
Par ailleurs, s’il y a bien une erreur à ne pas faire lors d’une refonte de site internet, c’est de croire que le fichier robots.txt vous protège. Certes, ce fichier sert d’intermédiaire entre les robots de Google et votre site, mais il n’est pas toujours efficace pour bloquer l’indexation.
Quelques solutions pour fermer l’accès à votre espace de préproduction aux robots d’indexation
Au lieu de compter sur le fichier robots.txt qui n’est pas fiable à 100%, il vaut mieux opter pour d’autres solutions simples et efficaces.
Restreindre l’accès à votre site avec un mot de passe
L’utilisation d’un nom d’utilisateur et d’un mot de passe est la solution par excellence pour sécuriser un espace web. C’est valable aussi pour votre environnement de préproduction. Google ne peut pas fournir l’user name et le mot de passe pour indexer vos contenus.
C’est une solution facile à mettre en place si vous utilisez un CMS. Il suffit d’activer le mode maintenance. Cependant, tout le monde n’a pas accès à cette fonctionnalité. Dans ce cas, créez un fichier .htpasswd pour configurer le système d’authentification.
Bloquer l’accès aux adresses IP inconnues
La restriction par adresse IP est aussi un bon moyen de protéger un site en développement et d’éviter qu’il soit indexé. Le principe est assez simple. Il consiste à autoriser l’accès au site à des adresses IP spécifiques. Ainsi, seuls les utilisateurs des appareils dont les adresses IP ont été inscrites sur la liste blanche pourront accéder à l’espace de développement et y faire des modifications. Google ne peut pas contourner cette restriction.
Utiliser une balise NoIndex
La balise NoIndex est aussi utile pour interdire aux moteurs de recherche de consulter et d’indexer un site. Vous pouvez la placer soit dans la section head de chaque page en tant que balise meta ou dans un en-tête de réponse HTTP. N’oubliez pas de la supprimer à la fin de la refonte.
Pour bloquer l’indexation des espaces de préprod sur Google, vous avez le choix entre la mise en place d’un système d’authentification, le filtrage par IP et l’utilisation de la balise NoIndex. Si l’erreur est déjà commise, vous pouvez me contacter afin que je vous aide à mettre en place une stratégie corrective.