Methodology OverRank
OverRank evaluates the visibility of a site against conversational AI (ChatGPT, Perplexity, Claude, Gemini). Each verification is noted, sourced and accompanied by an example of correction. No black box.
- Scientific foundations
- Princeton KDD 2024, AutoGEO ICLR 2026
- Standards applied
- RFC 9309, schema.org, llms.txt
- Score
- 0–100, 8 weighted categories
Exploration et indexation
Fichier robots.txt présent
See details →Vérifie qu'un fichier robots.txt est accessible en HTTP 200 à la racine du domaine.
Why it matters: robots.txt clarifie les règles d'exploration. Pour le GEO, le point critique reste que les pages utiles soient explorables et indexables.
Agents IA tiers autorisés
See details →Vérifie que des agents IA non Google comme GPTBot, ClaudeBot ou PerplexityBot ne sont pas explicitement bloqués.
Why it matters: Ce signal est utile pour certains assistants IA. Il reste complémentaire : le score GEO principal priorise crawl, contenu, données structurées et confiance.
Agents IA complémentaires
Fichier llms.txt présent
See details →Vérifie la présence de /llms.txt, format expérimental utilisé par certains agents IA complémentaires.
Why it matters: llms.txt n'est pas un prérequis GEO. Ce signal reste complémentaire, utile surtout pour certains agents IA tiers.
Titre H1 en début de fichier
See details →Vérifie que llms.txt commence par un titre niveau 1 (#) identifiant le site.
Why it matters: Le H1 donne l'entité principale à associer aux liens qui suivent.
Sections organisées (##)
See details →Vérifie que le fichier est structuré en sections niveau 2 (par ex. « Pages clés », « FAQ », « Documentation »).
Why it matters: Une structure claire permet aux moteurs de réponse de pondérer la pertinence de chaque lien selon le contexte demandé.
Liens vers les pages clés
See details →Vérifie que le fichier liste les URL prioritaires à consulter par les agents IA tiers.
Why it matters: Sans liens explicites, le fichier n'a aucune utilité pour diriger l'attention des modèles.
Citation via blockquote
See details →Vérifie la présence d'une citation en blockquote (> ...) résumant le site ou l'offre.
Why it matters: Ce format peut aider certains agents à lire un résumé, mais la priorité reste un contenu utile, clair et accessible dans la page HTML.
Profondeur ≥ 1 000 mots
See details →Vérifie que le fichier contient au moins 1 000 mots (seuil minimum pour citation probable).
Why it matters: Ce seuil est un signal expérimental pour agents tiers. Il ne remplace pas la qualité du contenu indexable dans les pages.
Profondeur ≥ 5 000 mots
See details →Vérifie que le fichier dépasse 5 000 mots (seuil optimal pour citation profonde).
Why it matters: Un volume élevé dans llms.txt n'est pas une exigence GEO. La priorité reste un contenu HTML utile, fiable et accessible.
Fichier llms-full.txt présent
See details →Vérifie la présence de /llms-full.txt, version étendue du fichier avec le contenu complet des pages clés.
Why it matters: Ce fichier peut aider certains modèles sans navigation, mais il reste complémentaire au score GEO principal.
Données structurées
Au moins un bloc JSON-LD valide
See details →Vérifie qu'au moins un <script type="application/ld+json"> valide est présent sur la page.
Why it matters: Le JSON-LD donne une lecture machine fiable de vos entités, pages et contenus.
Richesse des schémas (≥ 5 attributs/bloc)
See details →Vérifie que les schémas déclarés exposent suffisamment d'attributs pour être exploitables (nom, description, URL, image, sameAs…).
Why it matters: Un Organization avec juste {name, url} n'aide pas les modèles ; c'est la granularité (sameAs, founder, address…) qui crée la confiance.
Schema FAQPage
See details →Vérifie la présence d'un schéma FAQPage structurant les questions/réponses du site.
Why it matters: FAQPage structure les réponses directes quand la page contient réellement une FAQ visible.
Schema Article / NewsArticle
See details →Vérifie la présence d'un schéma Article ou NewsArticle pour le contenu éditorial.
Why it matters: Article/NewsArticle communiquent date, auteur et sujet — essentiels pour les contenus éditoriaux datés.
Schema Organization
See details →Vérifie la présence d'un schéma Organization avec au minimum name, url, logo et sameAs.
Why it matters: Organization clarifie l'entité du site. Les liens sameAs doivent pointer uniquement vers des profils officiels ou des sources tierces réellement existantes.
Schema WebSite
See details →Vérifie la présence d'un schéma WebSite décrivant le site (nom, URL, potentialAction SearchAction).
Why it matters: WebSite aide les moteurs à comprendre l'identité du site et peut exposer une recherche interne dans les résultats.
Contenu utile
Balise H1 unique
See details →Vérifie la présence d'un seul <h1> par page, clair et descriptif.
Why it matters: Le H1 est le titre sémantique principal. Zéro ou plusieurs H1 brouillent la compréhension de la page.
Présence de données chiffrées
See details →Vérifie que la page contient des chiffres (pourcentages, montants, dates) illustrant les affirmations.
Why it matters: Les données chiffrées rendent les affirmations plus vérifiables et plus faciles à reprendre dans une réponse.
Liens internes/externes
See details →Vérifie la présence de liens sortants vers des sources fiables et de liens internes vers vos pages clés.
Why it matters: Les liens externes autoritatifs renforcent la crédibilité quand ils appuient une affirmation importante.
Volume ≥ 300 mots
See details →Vérifie que la page contient au moins 300 mots de contenu éditorial.
Why it matters: En dessous de 300 mots, une page manque souvent de matière pour répondre clairement à une intention.
Hiérarchie des headings (H1 → H2 → H3)
See details →Vérifie que les titres suivent une hiérarchie logique sans saut (pas de H3 avant un H2, etc.).
Why it matters: Une hiérarchie propre segmente la page en blocs faciles à comprendre et à citer.
Listes ou tableaux
See details →Vérifie la présence de <ul>, <ol> ou <table> structurant l'information dense.
Why it matters: Les listes et tableaux rendent les informations comparables, scannables et réutilisables dans les réponses.
Front-loading (réponse dès le premier paragraphe)
See details →Vérifie que le premier paragraphe répond directement à la question posée par le H1.
Why it matters: Les réponses placées tôt dans la page sont plus faciles à identifier comme information principale.
Confiance
Nom de marque cohérent (title / schema / OG)
See details →Vérifie que le nom de la marque est identique entre <title>, schema Organization et meta og:site_name.
Why it matters: Une marque orthographiée différemment selon les champs crée une entité ambiguë et fragilise la confiance du rapport.
Description schema alignée avec meta
See details →Vérifie que la description du schéma Organization correspond à la meta description.
Why it matters: Des descriptions divergentes créent un signal de confusion : le site ne raconte pas la même chose selon les emplacements.
Sources d'autorité vérifiables
See details →Vérifie la présence de liens sameAs vers des profils officiels ou sources tierces fiables réellement existants.
Why it matters: Ces sources consolident l'entité de marque. Un lien inventé ou non maîtrisé dégrade la fiabilité du signal.
Page À propos accessible
See details →Vérifie la présence d'une page /about, /a-propos ou équivalent, linkée depuis la navigation.
Why it matters: La page À propos contextualise l'entité : histoire, équipe, mission, zone couverte et preuves de légitimité.
Informations de contact
See details →Vérifie la présence d'email, téléphone ou formulaire de contact structuré.
Why it matters: La traçabilité du contact est un signal de légitimité repris par les modèles.
Identité géographique (geo schema ou hreflang)
See details →Vérifie la présence de hreflang pour les variantes linguistiques ou d'un schéma geo (PostalAddress, Place).
Why it matters: La géo-identité aide à associer la bonne version du site à la langue, au pays ou à la zone de service de l'utilisateur.
Expérience
Attribut lang sur <html>
See details →Vérifie que la balise <html> déclare un attribut lang (ex. fr, en-US).
Why it matters: Sans lang, les moteurs peuvent mal attribuer la langue de la page et produire une restitution imprécise.
Flux RSS
See details →Vérifie la présence d'un flux RSS/Atom exposant les publications récentes.
Why it matters: Un flux RSS aide les crawlers IA à découvrir les nouveaux contenus sans re-parser tout le site.
Fraîcheur (date de publication/mise à jour)
See details →Vérifie la présence d'une date lisible (JSON-LD datePublished, <time>, meta article:modified_time).
Why it matters: La fraîcheur aide à distinguer les contenus maintenus des contenus potentiellement obsolètes.
Risques qualité
/.well-known/ai.txt ou équivalent
See details →Vérifie la présence d'un fichier /.well-known/ai.txt décrivant les règles d'accès pour agents IA.
Why it matters: Le standard ai.txt (emerging) permet aux agents autonomes de négocier l'accès aux données sans ambiguïté.
Résumé IA (summary) valide
See details →Vérifie l'exposition d'un endpoint JSON ou d'une balise meta ai-summary résumant l'activité du site.
Why it matters: Un résumé structuré facilite l'extraction rapide des points clés par les agents IA tiers.
FAQ structurée exposée
See details →Vérifie la présence d'une FAQ lisible (FAQPage JSON-LD ou page /faq indexée).
Why it matters: Une FAQ est le format le plus repris par les modèles pour répondre aux questions courantes sur une marque.
Service exposé (Catalog / Offer)
See details →Vérifie la présence d'un schéma Service, OfferCatalog ou Offer décrivant vos produits.
Why it matters: Sans catalogue structuré, les offres sont plus difficiles à recommander en réponse à une intention d'achat.