Qualité du code HTML et SEO

HTML sémantique : structurer le contenu correctement

Le HTML sémantique, c'est l'utilisation des balises dans leur sens prévu. Une balise <h1> pour le titre principal de la page, des <h2> pour les sections, <article> pour le contenu éditorial, <nav> pour la navigation, <footer> pour le pied de page, <main> pour le contenu principal.

Ces balises donnent des indications à Google sur la hiérarchie et la nature de chaque partie du contenu. Un site où tout est emballé dans des <div> génériques oblige le robot à deviner la structure. Un site avec un HTML sémantique correct lui facilite la tâche et améliore l'accessibilité en bonus.

Balise HTML sémantique Rôle Impact SEO
<h1> à <h6> Hiérarchie des titres Signal de structure thématique fort
<article> Contenu éditorial autonome Aide Google à identifier le contenu principal
<nav> Navigation principale ou secondaire Distingue les liens de navigation du contenu
<main> Contenu principal de la page Signal d'accessibilité et de structure
<aside> Contenu secondaire ou complémentaire Pondération moindre accordée par Google
<figure> et <figcaption> Image avec légende Contexte sémantique autour de l'image

Les balises Hn (H1 à H6) font partie du HTML sémantique. Leur hiérarchie logique aide Google à comprendre quels sujets sont principaux et lesquels sont des sous-thèmes. Un seul H1 par page, des H2 pour les sections majeures, des H3 pour les sous-sections.

Erreurs de code courantes nuisibles au SEO

Erreur Impact SEO Correction
Plusieurs H1 sur une même page Dilue le signal du titre principal, confusion sur le sujet central Un seul H1, le reste en H2/H3
Texte dans des images sans attribut alt Contenu invisible pour Google, inaccessible aux lecteurs d'écran Alt descriptif sur toutes les images de contenu
Liens sans texte d'ancre significatif Google ne comprend pas la destination du lien Ancres descriptives, jamais "cliquez ici"
CSS ou JS bloquants dans le <head> Ralentit l'affichage, détériore le LCP Defer/async sur les scripts, CSS critique inline
Code trop lourd (non minifié, non compressé) Temps de chargement plus long, mauvaises métriques de performance Minification + compression Brotli/Gzip
Balise canonique absente ou mal configurée Risque de duplicate content entre URLs variantes Canonical sur toutes les pages vers l'URL de référence
Images sans dimensions width/height CLS élevé (décalage de mise en page) Toujours déclarer width et height dans le HTML

Ressources bloquantes : le problème le plus fréquent

Quand le navigateur charge une page, il lit le HTML de haut en bas. Si un fichier CSS ou JavaScript est chargé dans le <head> sans attribut spécial, le rendu de la page est interrompu jusqu'à ce que ce fichier soit téléchargé et exécuté. C'est ce qu'on appelle une ressource bloquante.

Les conséquences sont directes sur le LCP (Largest Contentful Paint) : l'élément principal de la page ne peut pas s'afficher tant que tous les scripts bloquants ne sont pas traités. Sur des connexions lentes (mobile 3G/4G), chaque ressource bloquante ajoute plusieurs secondes de délai.

Données structurées Schema.org : les opportunités manquées

Le balisage Schema.org permet de donner à Google des informations structurées sur le contenu d'une page : type de page, auteur, date, produit, avis, prix, etc. Ces informations peuvent déclencher des rich snippets dans les résultats de recherche (étoiles d'avis, prix, FAQ déroulante) qui augmentent le taux de clic.

Type de page Schéma recommandé Rich snippet possible
Article de blog / Lexique Article, BlogPosting Fil d'Ariane, date de publication
Page produit e-commerce Product, Offer, AggregateRating Prix, disponibilité, étoiles
Page FAQ FAQPage, Question, Answer Questions/réponses déroulantes dans les SERP
Recette de cuisine Recipe Temps de préparation, notes, ingrédients
Entreprise locale LocalBusiness Adresse, horaires, téléphone dans les SERP
Événement Event Date, lieu, prix dans les résultats

Code lourd et performance : l'impact direct sur les Core Web Vitals

Un code mal optimisé génère des fichiers plus lourds à télécharger. Les bonnes pratiques de base :

Accessibilité et SEO : deux objectifs convergents

Un code accessible est presque toujours un code bien structuré pour le SEO. Les deux disciplines partagent de nombreuses bonnes pratiques.

Outils pour vérifier la qualité du code

Lors d'un audit SEO technique, je commence systématiquement par ces vérifications avant d'analyser le contenu et les backlinks. Le code est la fondation : inutile de travailler sur le reste si la base est défaillante.