Yandexbot

Qu'est-ce que Yandex et pourquoi son bot existe

Yandex est le moteur de recherche dominant en Russie, avec une part de marché supérieure à 60 % dans ce pays. Il est également présent en Biélorussie, au Kazakhstan et dans d'autres pays d'ancienne Union soviétique. Contrairement à ce que l'on pourrait croire, Yandex n'est pas une simple copie de Google : il dispose de ses propres algorithmes, de ses propres critères de qualité et d'une interface adaptée aux spécificités linguistiques du russe.

Yandexbot est l'agent d'exploration qui permet à Yandex de découvrir, lire et indexer les pages web. Son fonctionnement est similaire à celui de Googlebot : il suit les liens, lit le contenu des pages et transmet les données au moteur pour indexation.

Différences entre Yandexbot et Googlebot

Caractéristique Yandexbot Googlebot
User-agent principal Yandex / YandexBot Googlebot
Plages IP déclarées Publiées par Yandex (plages 5.255.x.x, 77.88.x.x, 87.250.x.x) Publiées par Google
Moteur associé Yandex Search Google Search
Fréquence de crawl Plus espacée sur les sites non russophones Variable selon l'autorité du domaine
Respect du robots.txt Oui, conforme au standard Oui, conforme au standard

Il existe plusieurs variantes du bot Yandex selon l'usage : YandexImages pour les images, YandexVideo pour les vidéos, YandexNews pour les actualités. Tous respectent les directives du fichier sitemap et du robots.txt.

Comment gérer Yandexbot dans robots.txt

Pour la grande majorité des sites francophones, Yandexbot n'a pas d'impact direct sur le trafic organique. Il est inutile de le bloquer sauf dans des cas spécifiques. Voici les configurations courantes :

Exemple de règle spécifique pour Yandexbot dans un fichier robots.txt :

User-agent: Yandex
Disallow: /admin/
Disallow: /panier/
Allow: /

Si Yandexbot apparaît dans vos logs serveur avec une fréquence anormalement élevée, vérifiez que l'IP source correspond bien aux plages déclarées par Yandex. Un robot qui se présente comme Yandexbot sans provenir de ces plages est probablement un scraper à bloquer au niveau du pare-feu, pas dans le robots.txt.

Pour la grande majorité des projets SEO en France, l'effort sur Yandexbot est minimal. Ce qui compte c'est d'abord bien gérer l'indexation Google, puis éventuellement Bing, avant de s'intéresser à Yandex.