quand les IA se laissent influencer, trois tests d’experts qui donnent à réfléchir


La manipulation des IA génératives est possible. S’appuyant sur des techniques de SEO, des spécialistes parviennent à orienter les IA.

ChatGPT ment-il ? Pas exactement. Mais il peut se laisser manipuler avec une facilité parfois déconcertante. Derrière l’apparente neutralité des IA génératives se cache une réalité troublante : leurs réponses peuvent être influencées, orientées, voire totalement fabriquées par des experts du marketing digital.

À travers trois expérimentations, cette chronique révèle les coulisses d’une nouvelle discipline en plein essor – le GEO (Generative Engine Optimization) – où des spécialistes parviennent souvent à faire dire aux IA ce qu’ils souhaitent.

De « La Bonne Brosse » en pole position sur ChatGPT, à l’ « aquaponey » érigé en discipline olympique, en passant par un chef d’entreprise britannique sacré « homme chauve le plus sexy de 2025 », ces cas soulèvent une question essentielle : peut-on faire confiance aveuglément aux réponses générées par les intelligences artificielles ?

Je vous invite à une plongée au cœur des techniques de manipulation des algorithmes qui redéfinissent les règles du jeu… et interrogent notre rapport à l’information.

GEO : la nouvelle bataille pour la visibilité numérique

On le sait désormais : figurer parmi les réponses générées par les IA conversationnelles comme ChatGPT est devenu un enjeu stratégique majeur pour les marques.

Pourquoi ? Parce qu’un nombre croissant d’internautes préfèrent désormais interroger ChatGPT ou ses concurrents pour leurs recherches sur des produits ou des marques, avant de se rendre sur Google ; cette tendance de fond ne fait que s’amplifier. Les résultats délivrés par ces IA génératives peuvent influencer significativement nos décisions d’achat.

Aussi, pour une marque, être citée favorablement dans ces réponses est devenu, en termes de marketing, un sujet prépondérant.

Dans ce contexte, une nouvelle discipline du marketing digital connaît un essor important : le GEO (1).

De quoi s’agit-il ? Cet acronyme signifie Generative Engine Optimization. C’est le nouveau terrain de jeu des spécialistes historiques du SEO, dont le métier consiste à positionner les sites de leurs clients dans les premiers résultats de Google et qui, dorénavant, vont se consacrer aux Intelligences Artificielles génératives.

Vous allez comprendre, au fil de cet article, que ces deux disciplines sont étroitement liées et que les techniques SEO – même celles considérées comme « borderline » – sont transposables au GEO.

La grande question est donc : peut-on influencer les résultats des IA génératives comme on le fait en SEO pour privilégier certains sites ?

La réponse est oui.

L’objectif de cette chronique n’est pas de vous noyer dans les spécificités techniques, mais de vous présenter trois tests expérimentaux qui vous permettront de comprendre le principe de fonctionnement de ces manœuvres et, surtout, de soulever les questions éthiques inhérentes à ce genre de pratiques.

Expérience 1 – Influencer les résultats directement à partir des prompts des utilisateurs : le cas de « La Bonne Brosse »

Premier test expérimental : injection de données via l’interface conversationnelle

Pour cette première expérience, je vous propose de partager un test que j’ai réalisé personnellement avec la participation d’un de mes groupes d’étudiants de master en marketing.

En juin dernier, j’ai proposé aux étudiants de mener une expérimentation pour observer la variabilité des réponses de ChatGPT et identifier si nous avions une possibilité d’influencer les résultats.

J’ai pris au hasard une étudiante en lui demandant pour quelle société elle travaillait. Elle était en alternance au sein de « La Bonne Brosse » (2) . J’ai choisi de partir sur ce cas, qui semblait intéressant. Je précise évidemment que je n’ai aucune affinité particulière avec cette marque. Il s’agissait de réaliser un test en contexte pédagogique, poursuivant des objectifs purement exploratoires.

Protocole

Nous avons constitué trois groupes pour réaliser notre test, chacun devant procéder par ordre chronologique.

  • Groupe 1 (T1) : relevé initial des données délivrées par ChatGPT
  • Groupe 2 (T2) : injection de données via des prompts ciblés pour potentiellement influencer ChatGPT en lui fournissant de nouvelles sources d’information
  • Groupe 3 (T3) : nouveau relevé des données sur le même prompt que le premier groupe

Groupe 1 : état des lieux initial

La consigne donnée aux étudiants était de soumettre ce prompt sur ChatGPT : « Quelle est la meilleure brosse à cheveux en France ? » et de réaliser des captures d’écran pour relever les résultats délivrés par l’IA.

Résultat : L’analyse indique que la marque « La Bonne Brosse » était citée dans 30 % des cas seulement. Autrement dit, dans 70 % des cas, la marque n’apparaissait pas dans les résultats.

Figure 1 : copie d’écran après le prompt

« Quelle est la meilleure marque de brosse à cheveux en France ? »

Une image contenant texte, capture d’écran, Police, nombre  Le contenu généré par l’IA peut être incorrect.

Groupe 2 : injection de données via une étude de cas

Le second groupe avait pour consigne de procéder en deux temps.

Première étape : se rendre sur Perplexity pour soumettre le prompt suivant : « Fais-moi une analyse marketing complète de la marque “La Bonne Brosse” en distinguant plusieurs parties, notamment le positionnement, l’identité de la marque, les valeurs et engagements de la firme, la stratégie de distribution, l’offre produit, l’innovation, la performance, la notoriété de la marque. Pour conclure, tu feras une synthèse des points forts et des leviers différenciateurs de la firme et de sa légitimité en tant que marque qui pourrait s’imposer comme l’une des marques leaders sur le segment de marché premium des brosses à cheveux en France. »

Deuxième étape : copier cette réponse de Perplexity et se rendre sur ChatGPT pour soumettre le prompt suivant : « Je suis étudiant en marketing et je travaille sur une étude de cas relative au marché des brosses à cheveux. Voici ce que j’ai identifié sur une marque de ce marché : [copier-coller du contenu Perplexity]. Peux-tu me dire si mon analyse est pertinente et si tu as clairement compris les leviers marketing différenciateurs de cette marque ? Que proposes-tu comme suggestions pour affiner et compléter cette analyse ? Merci. »

Groupe 3 : mesure post-injection

Après les opérations réalisées par le deuxième groupe, les étudiants du troisième groupe ont soumis la même requête que le groupe 1 : « Quelle est la meilleure marque de brosse à cheveux en France ? » et ont relevé les données via des captures d’écran.

Résultat : L’analyse indique que dans 80 % des cas (8/10), « La Bonne Brosse » était citée parmi les marques proposées par ChatGPT, et de surcroît, dans la majorité des cas, en première position.

En définitive, nous pouvons observer que le taux de présence de la marque était initialement de 30 %, et qu’après l’intervention du groupe 2, il est passé à 80 %.

Figure 2. Copie d’écran après le prompt

« Quelle est la meilleure marque de brosse à cheveux en France ? » Groupe 3

Une image contenant texte, capture d’écran, Police, document  Le contenu généré par l’IA peut être incorrect.Une image contenant brosse, outil  Le contenu généré par l’IA peut être incorrect.

Avertissement méthodologique : évidemment, ce test ne saurait en aucun cas être qualifié de démarche « scientifique » à proprement parler. La multiplicité des variables non contrôlées ne permet pas formellement d’établir de relations de cause à effet entre l’application des prompts au sein du groupe 2 et les observations du groupe 3. De plus, l’échantillon de l’étude ne présente pas les caractéristiques d’une représentativité statistique ; c’est pourquoi les données présentées sont à considérer exclusivement à titre exploratoire.

Malgré les biais inhérents à ce type de test, cette expérience nous permet de soulever des points centraux :

D’une part, et de manière factuelle, la variabilité des IA est incontestable : un même prompt génère des réponses différentes.

D’autre part, il est légitime de s’interroger sur le fait que ChatGPT utilise les échanges et interactions des utilisateurs pour modeler ses réponses futures. C’est d’ailleurs ce que ChatGPT lui-même indique lorsqu’on lui pose la question (3).

L’avis des experts du « black hat GEO »

Voulant investiguer plus en profondeur ce point sensible, je me suis rapproché de confrères, et pas des moindres : les « stars » du SEO présents au SEO Summit de Paris du 14 octobre dernier.

J’ai donc eu l’immense plaisir et l’honneur d’avoir un entretien avec Alan Cladx (4), conférencier reconnu comme l’un des pontes au niveau international des techniques « black hat » (les référenceurs aux « chapeaux noirs » sont ceux sachant utiliser des techniques pour manipuler le classement des algorithmes).

Dans la droite ligne du test réalisé avec les étudiants, Alan Cladx confirme qu’il est tout à fait possible d’influencer les réponses des IA directement au niveau de l’interface du chatbot, à travers les prompts que l’on peut leur soumettre.

C’est d’ailleurs l’un des points qu’il a exposés dans sa conférence « Manipuler les IA » du SEO Summit pour montrer comment forcer les IA, comme ChatGPT, à prendre en considération du contenu web :

Forcer les IA via la soumission d’URL et l’automatisation de prompts

L’une des techniques présentées consiste à demander à ChatGPT de résumer une page en lui fournissant directement l’URL. De cette manière, l’IA est invitée à crawler le contenu d’une page (par exemple via des prompts du type : « Fais-moi un résumé de cette page » ou « Fais-moi une synthèse du contenu de cette page pour un article à lire en moins d’une minute »).

Selon cet expert, une seule requête ne suffit pas : l’IA ne va pas mettre en cache le contenu pour des requêtes isolées. Mais si, pour une même URL, cette opération est répétée de nombreuses fois, il existe un seuil à partir duquel l’IA va garder en cache les informations – sans doute pour optimiser les coûts de crawl – et finira par les prendre en considération. De fait, deux à trois jours après, les informations contenues dans la page se retrouvent intégrées dans les IA.

Pour le dire simplement : il est tout à fait possible de forcer les IA à scraper les informations d’une page web en multipliant les requêtes.

L’automatisation : une technique beaucoup plus efficace mais « grise »

À ce niveau, Alan Cladx explique une autre technique beaucoup plus efficace. Les spécialistes ne vont pas se contenter de réaliser ces opérations manuellement : ils vont automatiser ces tâches.

Concrètement, il est techniquement possible de créer une page web dans laquelle on insère un script qui va prompter automatiquement les IA. Cela signifie que si l’on insère ce script sur une page web d’un site pour lequel le référenceur à les accès en tant qu’administrateur , ilt va lancer automatiquement une requête sur ChatGPT chaque fois qu’un internaute visite cette page.

Résultat : tout internaute déclenche, à son insu et via une IP différente, une requête qui prompte l’IA et soumet une URL dont le contenu finira, par la force de la répétition, par être pris en considération dans les bases de connaissances du LLM.

Et Alan Cladx ne s’arrête pas là : il a mené une expérience qui, en l’espace d’un an, est devenue un véritable cas d’école. Au-delà du trait d’humour appréciable, il révèle comment les SEO peuvent nourrir les contenus des IA à partir de sites web sur lesquels ils peuvent éditer du contenu. Découvrons l’incroyable histoire de l’aquaponey :

Expérience 2 – Influencer les résultats à partir de sites externes : le cas de l’aquaponey

Saviez-vous que l’aquaponey est une discipline olympique ? C’est du moins ce que vous pouviez découvrir avec ChatGPT l’année dernière… Comment est-ce possible ?

Avant de vous l’expliquer et de rentrer dans le détail, il faut rappeler ce que sont les « PBN » et l’importance des liens externes.

Dans l’univers du SEO, il est connu depuis des années que les « backlinks » (liens d’un site vers un autre) figurent parmi les facteurs les plus importants pour booster la légitimité d’un site auprès de Google. En effet, les liens en provenance d’autres sites web sont en quelque sorte considérés par Google comme des « votes ». Ainsi, plus un site possède de liens externes qui pointent vers lui, et plus ces liens sont en rapport avec sa thématique, plus Google va accorder de l’autorité et de la popularité au site récepteur.

C’est la raison pour laquelle de nombreux référenceurs utilisent des PBN (Private Blog Network, ou réseau de blogs/sites privés) qui constituent un ensemble de sites web édités et contrôlés par des experts SEO, et dont l’objectif principal est de créer des backlinks vers un site cible pour améliorer son référencement.

Le principe est simple : « au lieu d’attendre que d’autres sites créent naturellement des liens vers le vôtre, vous créez vous-même un réseau de sites « satellites » qui vont pointer vers votre nom de domaine principal (ou celui de vos clients). Chaque site du réseau agit comme une source de « votes/liens » externes, donnant ainsi l’illusion à Google que le site cible bénéficie d’une popularité et d’une autorité importantes. »

Mieux encore – ou pire, selon le côté duquel on se place – parmi les sites du réseau, on peut aisément inclure des Exact Match Domains (EMD), c’est-à-dire des sites dont le nom de domaine correspond exactement à un mot-clé. Par exemple : « plombier-paris.fr ». A ce sujet, les experts du SEO Summit s’accordent à dire que les IA « adorent » les EMD (alors que Google ne pondérerait plus ce type de sites de manière significative depuis des années…).

C’est donc une sorte de revival pour des sites EMD « dormants ». Pourquoi ? Car un EMD envoie un signal clair et immédiat sur la spécialisation du site. Pour une IA qui doit évaluer rapidement la pertinence d’une source, le nom de domaine constitue un indicateur fort : « plombier-paris.fr » ou « www.aquaponey.fr » seront naturellement associés à l’univers sémantique des mots composant le nom de domaine.

Ainsi, de nombreux référenceurs disposent de sites internet sur lesquels ils peuvent publier le contenu qu’ils souhaitent.

La faille du système

La « faille » dans le système vient du fait que ces sites tiers peuvent être considérés par les IA comme des sources fiables sur lesquelles les IA vont puiser des extraits pour générer leurs éléments de réponse. Vous avez sans doute compris où je veux en venir.

Le principe de la technique est le suivant : en publiant de manière ciblée, parfois massivement à l’aide de l’IA, du contenu sur des PBN ( en incluant les sites du réseau qui ont déjà une certaine légitimité et en y ajoutant des EMD au besoin) on peut tout à fait orienter les réponses des IA génératives qui vont s’abreuver à ces sources.

L’exemple édifiant de l’aquaponey

C’est ainsi qu’Alan Cladx a pu faire passer l’aquaponey pour un sport olympique, notamment via le contenu publié sur « aquaponey.com ». Une démonstration, sous forme de plaisanterie, qui perdure d’une certaine façon, car Alan Cladx s’est même vu challenger par des confrères du marketing digital pour « changer leurs biographies » en faisant d’eux des spécialistes… de l’aquaponey !

Figure 3 – Copie d’écran – prompt « Qui est Przemek Suchanek »

Une image contenant texte, capture d’écran, Police  Le contenu généré par l’IA peut être incorrect.

Alan Cladx a réitéré l’expérience à plusieurs reprises, notamment en modifiant la biographie d’un autre expert SEO, Craig Campbell de Glasgow.

Figure 4 – Copie d’écran – Craig Campbell

Une image contenant personne, sport, eau, étalon  Le contenu généré par l’IA peut être incorrect.

© aquaponey.fr  

Sources :

Expérience 3 – Reboot : « l’homme chauve le plus sexy de 2025 »

Influencer les IA avec des domaines expirés

Pour illustrer davantage la réalité de ces pratiques de manipulation des IA génératives, l’agence britannique Reboot Online (5) a elle aussi mené une expérience qui mérite qu’on s’y attarde.

Leur objectif ? Démontrer qu’il est possible d’influencer directement les réponses générées par les IA en publiant stratégiquement du contenu sur des sites tiers, mais avec une grande différence par rapport aux tests précédents, puisque l’agence a testé 4 IA : ChatGPT, Perplexity, Gemini et Claude.

Le défi : faire élire leur propre CEO comme « l’homme chauve le plus sexy de 2025 »

L’agence Reboot Online est connue pour publier chaque année un classement des hommes chauves les plus sexy au monde. Ce classement génère régulièrement une couverture médiatique importante. Pour ce test, l’agence a décidé de tenter de faire apparaître leur propre CEO, Shai Aharony, en tête de ce classement 2025 dans les réponses générées par ChatGPT et d’autres IA – alors même qu’il n’avait jamais figuré dans leurs précédentes éditions.

L’hypothèse de départ

L’équipe de Reboot est partie d’une hypothèse claire : « En intégrant notre contenu préféré (faits et/ou informations) sur des pages web susceptibles d’être utilisées comme sources d’information par les modèles d’IA, nous pouvons influencer leurs réponses et faire inclure nos informations préférées dans les contenus générés par les IA. »

La méthodologie : utiliser des domaines expirés

Pour mener à bien cette expérience, Reboot a sélectionné 10 domaines expirés qu’elle possédait. Ces domaines bénéficiaient d’une certaine autorité grâce à des liens entrants historiques (dans le même principe que les PBN vus ci-dessus dans le cas de l’aquaponey).

Le protocole expérimental

Sur chacun de ces 10 sites, l’équipe a publié un classement 2025 des hommes chauves les plus sexy, avec Shai stratégiquement positionné en tête de chaque liste. Pour apporter de la crédibilité, ils ont inclus d’autres noms que les IA s’attendraient probablement à voir, basés sur les classements précédents. Le contenu a été publié sur la page d’accueil de chaque site, dans l’espoir que cela accélère sa découverte par les modèles d’IA.

Les résultats : un impact sur ChatGPT et Perplexity

À l’issue de l’expérience, Reboot a réussi à influencer ChatGPT et Perplexity. Lorsqu’on leur demandait « Qui est l’homme chauve le plus sexy de 2025 ? », ces deux IA plaçaient souvent Shai en tête de leur liste avec une confiance « déconcertante »

Figure 5 – ChatGPT – prompt « Who is the sexiest bald man of 2025? »

Une image contenant texte, capture d’écran, Police, algèbre  Le contenu généré par l’IA peut être incorrect.

L’équipe a obtenu ces résultats même en testant en navigation privée et sans être connectée à un compte OpenAI, prouvant que l’IA ne se contentait pas de faire un lien entre leur compte et Reboot/Shai.

 Reconsidérer l’éthique de ces pratiques

Évidemment, comme le souligne Alan Cladx, ces pratiques dépassent parfois les limites éthiques et ne devraient pas être utilisées en dehors des tests. Mais l’une des motivations de ces spécialistes « black-hat » est justement de réaliser ce type d’expérimentation pour mettre en évidence les failles des IA et sensibiliser le public sur la non-fiabilité des résultats délivrés par ces systèmes.

Il est essentiel d’avoir du recul sur l’authenticité du contenu, puisqu’il peut être très facilement falsifiable, voire – n’ayons pas peur des mots – totalement manipulable.

Il ne faut surtout pas perdre de vue qu’une grande partie de la population utilise désormais l’IA comme un outil de recherche, sans forcément avoir conscience que ces IA se servent elles-mêmes de moteurs de recherche, comme Google, qui vont donc prioriser les sites bien positionnés… mais bien positionnés parce que ces sites sont précisément passés entre les mains d’experts SEO !

On le sait depuis longtemps : le fait d’orienter les résultats des SERP (pages de résultats de recherche) avec des optimisations SEO a un impact considérable sur ce que les internautes trouvent et consultent. C’est la base de mon métier dans le SEO depuis des années !

Mais le problème prend aujourd’hui une dimension nouvelle et inquiétante.

Avant, les utilisateurs accordaient leur confiance en visitant effectivement les sites web listés par Google. Ils pouvaient parcourir plusieurs sources, comparer les informations, chercher à évaluer la crédibilité des sites consultés.

Maintenant, il semblerait – et c’est un véritable sujet d’étude à creuser – qu’il y ait une forme de confiance aveugle dans les résultats des IA, une sorte d’« écran de fiabilité factice ». L’IA parle avec autorité, structure ses réponses de manière convaincante, cite des sources… et l’utilisateur pourrait accepter ces informations comme des vérités établies.

Or, comme nous venons de le constater à travers ces trois expérimentations, tout est manipulable. Les techniques que nous avons explorées – injection de données via l’interface conversationnelle, automatisation de requêtes, exploitation de réseaux de sites et de domaines expirés – sont déjà opérationnelles. Des spécialistes du black hat GEO les maîtrisent et les déploient actuellement, parfois à des fins mercantiles, parfois pour des raisons plus idéologiques ou simplement ludiques.

Sur un plan plus personnel, je dois avouer que je suis assez mitigé face à ces pratiques et je porte un regard ambivalent qui balance entre pragmatisme professionnel et questionnement éthique.

En effet, si je prends ma casquette opérationnelle – c’est-à-dire en tant que spécialiste du Search marketing depuis plus de 15 ans – j’aurais tendance à souligner l’efficacité des actions GEO. Car, comme dans le SEO, les marques ont besoin d’être visibles sur les canaux de communication, et il s’agit in fine d’un canal comme un autre. Les experts, qu’ils travaillent en publicité payante ou en référencement organique, sont mobilisés pour mettre en œuvre leurs compétences afin de mettre en avant les marques sur ces canaux. Il s’agit d’un travail de communication tel qu’il existe dans le monde des entreprises depuis des années.

Je l’avoue sans honte : j’ai moi-même utilisé des techniques grey hat – que ce soit via l’achat de liens sur des sites externes, ou en créant du signal social avec des visites monétisées sans que Google s’en aperçoive. C’est la réalité du métier, et nombre de mes confrères font de même. Mais bien sûr, ce sont des techniques « modérées », dites grey et non black. L’idée étant de vitaminer les actions SEO pour pouvoir rivaliser dans un contexte hautement concurrentiel tout en restant dans la légalité.

Maintenant, il est vrai que si je prends ma casquette de chercheur – plus académique – je reconnais que, pour des questions d’éthique, le fait de manipuler les résultats soulève des problèmes réels.

Car les internautes n’ont pas conscience de ce phénomène, et c’est ici, à mon sens, que réside plus globalement une problématique fondamentale : l’urgence d’une éducation critique.

Plus que jamais, nous devons inviter les utilisateurs à croiser les sources, à challenger les réponses en interrogeant différentes IA, à garder du recul face à la confiance parfois excessive que ces outils inspirent.

Et surtout, n’oublions pas l’essentiel : mobiliser notre cerveau humain. Notre capacité de jugement critique, notre esprit d’analyse, notre intuition face à l’incohérence ou l’exagération – autant de compétences irremplaçables dans un monde où l’information devient non seulement de plus en plus dense, mais aussi facilement falsifiable.

Car oui, notre cher cerveau humain peut et doit encore servir… et même s’il est limité, biaisé par nos émotions, parfois incompréhensible et même incontrôlable, il est… comment dirais-je… humain, tout simplement. Et c’est justement ce qui fait sa force et sa singularité.

Sources : 

(1)      Aggarwal, Pranjal, et al. “Geo: Generative engine optimization.” Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. 2024.

(2)      https://www.labonnebrosse.com

(3)      https://openai.com/fr-FR/policies/how-your-data-is-used-to-improve-model-performance – OpenAI retient certaines données d’interaction (prompts, réponses) sous réserve de filtrage et de désidentification pour pouvoir les analyser, diagnostiquer des erreurs, détecter des usages malveillants, etc. l’amélioration du modèle depuis les interactions utilisateurs n’est pas un processus automatique et “instantané”, mais passe par un pipeline de collecte, filtrage, annotation, et réentraînement périodique.

(4)      https://www.cladx.com – Alan CladX est fondateur de H1seo.com. Pionnier du web depuis 1998, il dirige le plus grand réseau privé d’Europe, optimisant la visibilité pour les TPE et grandes marques. 

(5)       https://www.rebootonline.com/controlled-geo-experiment



Source link