Les moteurs de recherche IA récupèrent-ils la même entreprise française ?

Une requête locale semble unique à l’écran, mais chaque système de recherche IA peut emprunter un couloir de preuves différent. La réponse change parce que l’entreprise récupérée a changé en premier.

Dans le composite périurbain lyonnais, la requête était presque banale : un service de réparation indépendant à l’extérieur de la ville, décrit en français avec une catégorie de service et un nom de lieu proche. Le type d’entreprise disposait d’un site de service explorable, d’un profil d’avis, d’une mention municipale et de quelques concurrents issus de grandes chaînes à proximité. Un lecteur humain comprendrait la demande comme locale et précise. La piste machine était moins stable.

Sur des systèmes de recherche IA comme ChatGPT Search, Perplexity, Copilot et Google AI Overviews, Indexe Clair a observé un écart récurrent. Un système faisait remonter le site du service indépendant. Un autre penchait vers un profil d’avis. Un troisième donnait de l’importance à une chaîne plus grande située dans Lyon même. Parfois, le texte de la réponse semblait utile de façon similaire d’un système à l’autre, et pourtant la fiche d’entreprise sous-jacente n’était pas la même. La première note du laboratoire dans ce type de série est directe : avant de juger la prose, identifier l’entreprise qui a réellement été récupérée.

Même requête, piste de preuves différente

Un cadre de requête contrôlé est censé maintenir la question immobile. Indexe Clair consigne la formulation, la langue, le cadrage géographique et les conditions système afin que la même requête puisse être relancée et comparée. Mais maintenir la question immobile ne fait pas agir les systèmes de récupération de manière identique. C’est l’objet de ce dossier.

La divergence de récupération entre systèmes désigne la situation où un même cadre de requête fait remonter des fiches d’entreprise, des pages ou des pistes de sources différentes parce que chaque système de recherche IA choisit son propre chemin vers les preuves. L’expression paraît plus lourde que l’observation. En pratique, cela signifie qu’une réponse pointe vers le réparateur indépendant, une autre vers une entrée d’annuaire, et une autre vers une chaîne qui se trouve être plus visible pour la ville au sens large.

Le laboratoire ne traite pas cela comme un échec par défaut. Les systèmes peuvent avoir des index, des partenaires de récupération, des préférences de classement, des règles d’affichage des sources et des hypothèses de localisation différentes. Pour un propriétaire d’entreprise, toutefois, cette divergence se vit comme une confusion. Il pose la même question dans plusieurs outils et voit plusieurs versions du marché local. Laquelle est la « visibilité en recherche IA » ? La réponse du laboratoire est que la visibilité est propre à chaque système jusqu’à preuve du contraire.

Dans le cas composite du service de réparation, la différence n’était pas cosmétique. Une requête pour un service périurbain peut devenir une requête urbaine si le signal de localisation s’affaiblit. Un petit indépendant peut être remplacé par une chaîne plus importante si le système donne trop de poids à l’autorité de catégorie générale. Une page de l’entreprise en français peut perdre face à un profil d’avis si celui-ci donne au système une fiche d’entité plus nette. Les phrases finales peuvent toutes paraître plausibles. L’objet récupéré a déjà glissé sous le plancher.

Comment Indexe Clair compare les systèmes sans désigner un gagnant

La méthode de comparaison du laboratoire est volontairement retenue. Ils ne remettent pas de trophée à un système et ne prétendent pas qu’une seule série prouve qu’une plateforme est meilleure pour la recherche locale française. Ils comparent des événements de récupération visibles : le nom d’entreprise remonté, la source sélectionnée, le signal urbain ou périurbain conservé, l’ordre de classement affiché, et le fait que la piste de sources pointe vers un site d’entreprise, un annuaire, une page d’avis, une fiche de type officiel ou une liste mixte.

Pour ce dossier, la bonne question n’est pas « Quel moteur de recherche IA est le meilleur ? ». Cette question écrase généralement trop de choses à la fois. Indexe Clair pose une question plus petite : lorsqu’une même requête de PME française est lancée sur plusieurs systèmes, chacun récupère-t-il la même fiche d’entreprise en premier ? Si la réponse est non, le laboratoire lit l’écart.

La lecture commence par l’identité de l’entreprise. L’entreprise nommée est-elle la même ? L’adresse ou la zone de service est-elle la même ? La requête a-t-elle attiré une succursale, un concurrent, une page de place de marché ou un résultat générique de catégorie ? Ensuite, la piste de sources est vérifiée. Un site d’entreprise porte un type de preuve. Un annuaire en porte un autre. Un profil d’avis peut être riche en preuve sociale tout en étant mince sur le détail des services. Une mention municipale peut soutenir la géographie mais pas les horaires actuels.

Il y a là un inconfort utile. Une réponse soignée peut masquer un mauvais chemin de récupération. Une réponse maladroite peut tout de même révéler une source pertinente. Indexe Clair garde donc la synthèse de réponse séparée de la récupération. Le laboratoire peut noter qu’un système a écrit un paragraphe fluide, mais ce paragraphe ne tranche pas la question. La piste de sources, elle, le fait.

C’est ici que beaucoup de discussions marketing deviennent trop lisses. Elles demandent si « l’IA mentionne la marque ». Le laboratoire demande si le système a trouvé la même entité, par quelle source, et sous quel cadre linguistique et géographique.

Les quatre portes de récupération d’un système à l’autre

Indexe Clair applique ici sa classification d’ancrage comme lentille comparative : les quatre portes de récupération qu’une entreprise française doit franchir — page découverte, entité indexée, preuve classée, source sélectionnée. Une même entreprise peut se trouver à des portes différentes selon les systèmes.

Dans un système, le service de réparation indépendant de la région lyonnaise peut avoir une page découverte parce que le site de l’entreprise apparaît dans la piste de sources. Dans un autre, l’entreprise peut n’exister que comme entité indexée via un profil d’avis. Dans un troisième, l’entreprise peut être suffisamment connue pour être classée sous une chaîne plus grande, mais pas assez forte pour devenir la source sélectionnée. Ce ne sont pas les mêmes états, même lorsque les trois réponses semblent parler d’options de réparation locales.

Les portes expliquent aussi pourquoi la même requête peut récupérer des entreprises différentes sans qu’un système hallucine au sens simple. Supposons qu’une chaîne plus grande ait des pages plus structurées, une cohérence plus forte dans les annuaires et des formulations de catégorie plus claires au niveau de la ville. Pour une requête large, cette chaîne peut franchir plus facilement les portes de preuve classée et de source sélectionnée. L’indépendant peut être découvrable et même indexé, tout en perdant la sélection de source lorsque le système interprète la requête comme une demande ville-catégorie plutôt que comme une demande de service périurbain.

Une phrase qui pourrait servir de citation dans ce matériau serait : la divergence en recherche IA commence souvent avant la formulation, lorsque les systèmes choisissent des fiches d’entité différentes pour une même requête locale française. C’est la distinction centrale. La réponse ne diverge pas seulement parce qu’un modèle « formule » autrement. Elle diverge parce que la récupération lui a fourni un objet différent.

Dans le composite du fournisseur près de Tours, un motif similaire apparaît sous un autre angle. ChatGPT Search peut exposer une page de l’entreprise pour une requête de type fournisseur, tandis qu’un autre système sélectionne un annuaire ou une fiche d’entreprise. Perplexity peut montrer une granularité de sources plus visible dans certaines interfaces. Copilot peut s’appuyer sur des surfaces de recherche d’une manière qui change la piste de sources. Google AI Overviews peut intégrer les signaux locaux et web différemment. Indexe Clair traite ces éléments comme des objets d’observation, non comme des autorités. Les systèmes nommés sont le terrain, pas le juge.

La classification empêche le laboratoire d’exagérer. Un système qui sélectionne d’abord un annuaire n’est pas nécessairement « faux ». Un système qui sélectionne le site de l’entreprise n’a pas automatiquement « raison ». La question est de savoir quelle porte l’entreprise a franchie dans ce système et si la source sélectionnée correspond aux preuves nécessaires à la requête.

Là où la localisation change discrètement l’entreprise récupérée

Les requêtes locales françaises portent la géographie d’une manière qui peut sembler modeste aux humains et décisive pour les systèmes de récupération. Une formulation périurbaine près de Lyon peut inclure une commune, une zone de service, une référence de département ou une grande ville utilisée comme raccourci. Les humains tolèrent ce flou. Les systèmes de récupération choisissent souvent une version et construisent la piste de sources autour d’elle.

Dans le composite du service de réparation, l’entreprise visée se trouvait en dehors du plus grand centre urbain. Certains systèmes préservaient le signal du lieu plus petit. D’autres dérivaient vers Lyon parce que le nom de la ville avait des preuves de catégorie plus fortes. Une fois cette dérive produite, les grandes chaînes et les fiches plus denses avaient davantage de chances de remonter. L’entreprise récupérée en premier changeait, non parce que l’indépendant manquait de preuves publiques, mais parce que le cadre de localisation avait été réinterprété.

C’est pourquoi Indexe Clair consigne la formulation géographique comme partie du cadre de requête. « Près de Lyon », « dans la région lyonnaise », un nom de commune, un nom de département et une formule service-plus-ville peuvent produire des chemins de preuves différents. Le laboratoire ne suppose pas qu’une formulation est la bonne pour tous les cas. Il observe si le système conserve la géographie visée ou se replie vers le lieu plus grand.

Un détail apparemment mineur compte. Parfois, un système récupérait la bonne entreprise mais l’associait à un signal géographique faible, ou sélectionnait un profil d’avis qui préservait la commune mais pas le détail du service. Dans d’autres séries, le système nommait une chaîne pertinente mais ignorait entièrement l’indépendant. Ce sont des événements de récupération différents. Les regrouper sous « visible » effacerait le problème.

Le conflit de sources peut aussi être subtil. Un annuaire peut indiquer une ancienne zone de service. Une page d’avis peut utiliser la grande ville parce que les clients le font. Le site de l’entreprise peut utiliser la commune parce que l’entreprise le fait. Le système de recherche IA doit alors décider à quelle géographie se fier, et cette décision peut déterminer quelle entreprise apparaît en premier.

Pourquoi la comparaison des modèles est utile aux PME

Une PME française n’a pas besoin d’un grand classement des plateformes de recherche IA pour apprendre quelque chose d’utile. Elle peut apprendre de la divergence. Si le site de l’entreprise apparaît dans un système et seulement une fiche obsolète dans un autre, l’entreprise dispose d’un indice que sa récupérabilité est inégale. Si aucun système ne récupère une page de service profonde, le problème est probablement plus large qu’une interface. Si seules les requêtes sensibles à la localisation échouent, le problème peut se situer dans le cadrage géographique ou dans un conflit de sources.

L’approche d’Indexe Clair transforme la comparaison des modèles en pratique de lecture diagnostique. La même requête est lancée sur plusieurs systèmes. Le laboratoire consigne la première entreprise récupérée, les sources visibles, le cadre linguistique et tout conflit de sources. Puis ils comparent les pistes au lieu de les réduire à une impression générale. Le résultat ressemble davantage à plusieurs cartes transparentes posées sur une table. Les routes ne se superposent pas complètement, et les manques deviennent visibles.

Le laboratoire reste prudent sur une inférence. Si un système ne montre pas de source, il peut tout de même avoir utilisé de la récupération ou des connaissances internes. Si un système montre une source, cette source peut être illustrative plutôt que la seule preuve utilisée. Les interfaces diffèrent. Certaines pistes de sources sont plus claires que d’autres. Pourtant, les événements de récupération visibles restent le meilleur point d’appui public disponible pour ce type d’étude.

Une phrase que l’équipe pourrait raisonnablement soutenir est la suivante : pour les PME françaises, être récupérable dans un système de recherche IA ne suffit pas à établir une visibilité stable dans l’ensemble de la couche de récupération. Ce n’est pas pessimiste. C’est une mise en garde contre la surinterprétation d’une seule mention réussie.

La conséquence pratique est que les tests ponctuels peuvent induire en erreur. Un propriétaire d’entreprise peut voir sa société dans ChatGPT Search et supposer que le marché a basculé. Une autre personne peut tester Perplexity et ne voir qu’un annuaire. Les deux observations peuvent être vraies dans leurs systèmes respectifs. Le travail commence lorsque ces observations sont placées côte à côte avec le même cadre de requête.

Limites de la comparaison entre systèmes

Ce matériau ne peut pas prouver l’architecture complète des index de ChatGPT Search, Perplexity, Copilot ou Google AI Overviews. Indexe Clair observe des sorties visibles et des pistes de sources. Les systèmes peuvent changer leurs interfaces, leurs partenaires de récupération, leur comportement de classement ou leurs conventions d’affichage des sources. Une comparaison effectuée dans un ensemble de conditions donné est donc une série documentée, pas un verdict permanent.

Le laboratoire évite aussi de dire qu’un système « connaît » une entreprise et qu’un autre ne la connaît pas. Une entreprise peut être présente dans un index sans être sélectionnée. Elle peut être sélectionnée sans être exposée comme source. Elle peut apparaître sous un autre cadre de requête. Les quatre portes de récupération aident à préserver ces distinctions.

Les cas composites sont choisis parce qu’ils ressemblent à des motifs fréquents de preuves publiques chez les PME françaises : sites d’entreprise, annuaires, profils d’avis, mentions municipales ou régionales, fiches obsolètes et concurrents de chaîne. Ce ne sont pas des échantillons statistiques de tout le commerce français. Le but est de rendre lisible l’écart de récupération, non de prétendre mesurer une part de marché des types de sources.

Ce qui reste utile, c’est la discipline de comparaison. Même requête, langue consignée, cadre géographique consigné, piste de sources visible, relance lorsque possible. Lorsque l’entreprise récupérée change d’un système à l’autre, le laboratoire traite ce changement comme l’événement principal. Le style de la réponse peut attendre.