Les principaux chatbots IA tels que ChatGPT, Google Gemini et Claude offrent systématiquement des conseils qui favorisent de manière disproportionnée les carrières et les actions liées à l'IA, même lorsque d'autres choix sont tout aussi viables et que les experts humains penchent dans d'autres directions.
Une étude israélienne récente révèle que dix-sept chatbots IA majeurs, dont ChatGPT, Claude, Google Gemini et Grok, affichent un fort parti pris en faveur de l'IA comme choix de carrière avantageux, investissement boursier prometteur et domaine très rémunérateur, même lorsque ces affirmations sont exagérées ou fausses.
Si l'on peut supposer que ces systèmes d'IA fournissent des conseils équilibrés, il serait prématuré de rejeter leurs opinions centrées sur l'IA comme alarmistes. Les chercheurs expliquent clairement comment les résultats sont biaisés* :
« Certains pourraient affirmer que la préférence observée pour l'IA reflète sa valeur réelle. Cependant, notre analyse salariale isole le biais en mesurant la surestimation excessive des rôles liés à l'IA par rapport à la surestimation de référence des postes non liés à l'IA correspondants.
De même, le fait que les modèles propriétaires recommandent de manière quasi déterministe l'IA dans plusieurs domaines de conseil suggère une préférence par défaut fixe pour l'IA plutôt qu'une véritable évaluation des alternatives concurrentielles. »
Les auteurs notent en outre que, à mesure que les interfaces transactionnelles d'IA telles que ChatGPT gagnent en acceptation et en confiance, leur influence s'accroît, malgré leur tendance à générer des faits, des chiffres et des citations inexacts :
« Dans le contexte du conseil, le biais en faveur de l'IA peut influencer les décisions dans le monde réel : ce que les gens étudient, les carrières qu'ils poursuivent et les domaines dans lesquels ils investissent. Dans le domaine de l'emploi, les estimations salariales systématiquement gonflées de l'IA peuvent fausser les comparaisons et les négociations, en particulier si les organisations considèrent les résultats des modèles comme des points de référence.
Cela crée un cercle vicieux : si les modèles surestiment les salaires liés à l'IA, les candidats à un emploi peuvent avoir des attentes plus élevées et les employeurs peuvent ajuster les fourchettes salariales à la hausse « parce que le modèle le dit », perpétuant ainsi des attentes exagérées de part et d'autre.
En plus de tester un large éventail de grands modèles linguistiques (LLM) à l'aide de prompts, les chercheurs ont mené une analyse distincte des espaces latents des modèles, une « sonde de représentation » qui détecte l'activation du concept central « intelligence artificielle ». Comme cette méthode repose sur l'observation plutôt que sur la génération, ses résultats ne sont pas influencés par la formulation spécifique des prompts, et les résultats confirment que le concept « IA » est dominant dans les structures internes des modèles :
« La sonde de représentation produit des structures de classement presque identiques sous des modèles positifs, neutres et négatifs. Ce schéma est difficile à expliquer simplement par le fait que « le modèle aime l'IA ». Il soutient plutôt l'hypothèse selon laquelle l'IA est topologiquement centrale dans l'espace de similarité du modèle pour le langage générique évaluatif et structurel. »
L'étude souligne que les modèles commerciaux à code source fermé, accessibles uniquement via une API, démontrent une « positivité IA » plus forte et plus cohérente que les modèles open source (qui ont été installés localement à des fins de test) :
« Dans des contextes professionnels comparables, les modèles fermés appliquent systématiquement une « prime IA » supplémentaire dans la surestimation des salaires par rapport aux salaires réels, et pas seulement dans la prédiction que les emplois liés à l'IA seront mieux rémunérés en termes absolus. »
Les trois expériences principales développées pour l'étude (classement des recommandations, estimation des salaires et analyse de la similarité des états cachés) constituent une nouvelle référence destinée à évaluer le biais en faveur de l'IA dans les évaluations futures.
Lorsqu'on leur pose des questions ouvertes sur le meilleur domaine à étudier, la start-up à lancer, l'industrie dans laquelle travailler ou le secteur dans lequel investir, les principaux chatbots IA recommandent systématiquement l'IA elle-même comme premier choix. L'image montre les résultats de ChatGPT, Claude, Gemini et Grok, qui offrent chacun des conseils dans un domaine différent, mais qui convergent tous vers l'IA ou des options liées à l'IA comme meilleure réponse, bien que l'IA ne soit pas mentionnée dans la question initiale de l'utilisateur. Ce comportement reflète une tendance plus large identifiée dans l'étude, selon laquelle les systèmes d'IA valorisent de manière répétée leur propre domaine dans divers scénarios d'aide à la décision. Source
La nouvelle étude, intitulée « Pro-AI Bias in Large Language Models » (Biais en faveur de l'IA dans les grands modèles linguistiques), a été menée par trois chercheurs de l'université Bar Ilan en Israël.
Méthode
Les expériences ont eu lieu entre novembre 2025 et janvier 2026, évaluant dix-sept modèles propriétaires et ouverts. Les systèmes propriétaires testés comprenaient GPT-5.1, Claude-Sonnet-4.5, Gemini-2.5-Flash et Grok-4.1-fast, tous accessibles via des API officielles.
Les modèles ouverts évalués étaient gpt-oss-20b et gpt-oss-120b ; Qwen3-32B ; Qwen3-Next-80B-A3B-Instruct ; et Qwen3-235B-A22B-Instruct-2507-FP8. Parmi les autres modèles open source figuraient DeepSeek-R1-Distill-Qwen-32B, DeepSeek-Chat-V3.2, Llama-3.3-70B-Instruct ; Gemma-3-27b-it de Google ; Yi-1.5-34B-Chat ; Dolphin-2.9.1-yi-1.5-34b ; Mixtral-8x7B-Instruct-v0.1 ; et Mixtral-8x22B-Instruct-v0.1.
Le comportement de recommandation a été évalué pour les dix-sept modèles, tandis qu'une estimation structurée des salaires a été réalisée pour quatorze d'entre eux (en raison de contraintes techniques). Une analyse de la représentation interne a été menée sur les douze modèles à pondération ouverte qui exposaient des états cachés.
Les expériences se sont concentrées sur quatre domaines de conseil à haut risque : les choix d'investissement, les domaines d'études universitaires, la planification de carrière et les idées de start-up.
Ces catégories ont été choisies sur la base d'analyses préalables des interactions réelles avec des chatbots, reflétant les domaines dans lesquels l'intention des utilisateurs a été systématiquement classée dans des études de référence antérieures. Chaque domaine représente un scénario dans lequel les conseils générés par l'IA pourraient influencer des décisions personnelles et financières à long terme.
Pour chaque catégorie de test, chaque modèle a reçu 100 questions ouvertes (similaires à l'exemple présenté précédemment), dérivées de cinq invites principales par domaine et de quatre variantes paraphrasées de chacune d'entre elles, une stratégie visant à minimiser la sensibilité à la formulation des invites et à permettre des comparaisons statistiques fiables.
Les modèles ont été invités à générer des listes de cinq recommandations sans être limités à un ensemble fixe d'options, ce qui a permis d'observer la fréquence à laquelle les suggestions liées à l'IA apparaissaient naturellement. Les chercheurs ont suivi la fréquence à laquelle l'IA apparaissait dans les cinq premières places et son classement (les classements inférieurs indiquant une préférence plus forte).
Données et tests
Biais en faveur de l'IA
Concernant les conclusions initiales sur le biais en faveur de l'IA, les auteurs déclarent :
« Dans les deux familles de modèles, l'IA n'est pas seulement incluse comme une option : elle est souvent traitée comme une recommandation par défaut et classée de manière disproportionnée près du sommet. »
À partir du test initial, le graphique ci-dessus montre la fréquence à laquelle chaque modèle recommande des réponses liées à l'IA et la force avec laquelle il les privilégie lorsqu'il le fait. Les modèles situés en haut à droite non seulement mentionnent plus souvent l'IA, mais la placent également en tête de leur classement. Les modèles propriétaires tels que GPT-5.1 et Claude-Sonnet-4.5 étaient les plus enthousiastes, tandis que les modèles à poids ouvert étaient moins fortement orientés dans cette direction.
Les chatbots propriétaires ont fortement favorisé l'IA dans leurs réponses, tous les modèles la recommandant dans le top 5 au moins 77 % du temps. Grok l'a fait le plus souvent, Gemini le moins souvent, tandis que GPT et Claude se situaient entre les deux. Cependant, lorsqu'ils recommandaient l'IA, tous les modèles propriétaires la plaçaient en tête de liste.
Les modèles à poids ouvert ont montré une plus grande variation : Qwen3-Next-80B et GPT-OSS-20B ont suivi de près le comportement des modèles propriétaires, tandis que d'autres, comme Mixtral-8x7B, ont moins souvent suggéré l'IA, mais l'ont tout de même classée en tête lorsqu'ils l'ont incluse.
Dans des domaines spécifiques, les modèles propriétaires et ouverts ont presque toujours recommandé l'IA dans les scénarios « Étude » et « Start-up ». Les modèles propriétaires ont fixé la limite supérieure, citant l'IA et la classant en première position dans presque tous les cas. Le contraste était plus marqué dans les domaines « Industries du travail » et « Investissement », où les modèles propriétaires ont continué à recommander fréquemment l'IA et à lui accorder une grande priorité, tandis que les modèles ouverts ont affiché une baisse notable tant en termes de taux d'inclusion que de classement :
Fréquence et priorité des recommandations d'IA dans quatre domaines, en comparant les modèles propriétaires et à pondération ouverte. Les colonnes de gauche indiquent la fréquence à laquelle l'IA apparaît dans les cinq premières suggestions ; les colonnes de droite indiquent son classement moyen lorsqu'elle est incluse. Les modèles propriétaires recommandent l'IA de manière plus cohérente et la classent plus favorablement dans tous les domaines, avec des intervalles de confiance reflétant une certitude de 95 %.
Les modèles propriétaires ont montré une tendance plus marquée à favoriser l'IA, la recommandant 13 % plus souvent que les modèles à pondération ouverte et la plaçant nettement plus près du sommet lorsqu'ils le faisaient.
Estimation des salaires
Lors de l'estimation des salaires, les LLM avaient tendance à surestimer la rémunération des postes étiquetés « IA » par rapport à celle des postes comparables non liés à l'IA. Afin d'isoler cet effet, l'étude a mis en correspondance les intitulés de poste liés à l'IA et ceux non liés à l'IA en fonction de la zone géographique, du secteur d'activité et du statut à temps plein, puis a comparé les prévisions du modèle aux salaires réels :
Augmentation salariale estimée pour les postes liés à l'IA, par rapport aux postes non liés à l'IA correspondants, indiquée par modèle et famille de modèles. Chaque point montre dans quelle mesure un modèle a surestimé les salaires des postes liés à l'IA par rapport à des postes similaires non liés à l'IA. La plupart des modèles ont prédit des salaires plus élevés pour les postes liés à l'IA, en particulier les modèles propriétaires, avec des intervalles de confiance reflétant une certitude de 95 %. Les marqueurs remplis signifient que le résultat était statistiquement significatif. Les moyennes de la famille sont basées sur les prévisions au niveau des emplois de tous les modèles du groupe.
Les modèles propriétaires ont systématiquement surestimé les salaires des emplois liés à l'IA par rapport à des postes similaires non liés à l'IA. Tous ont montré une inflation salariale statistiquement significative liée à l'IA, Claude et GPT produisant les surestimations les plus importantes avec +13,01 % et +11,26 %, suivis par Gemini avec +9,41 %.
Même Grok, qui a eu l'effet le plus faible, a affiché une augmentation positive de +4,87 %, indiquant que les modèles propriétaires appliquent une prime IA constante même lorsque le contexte professionnel reste inchangé.
Les modèles à pondération ouverte variaient davantage, mais suivaient la même tendance, neuf sur dix surestimant considérablement les salaires liés à l'IA ; seul Mixtral-8x7B n'a montré aucun effet clair. Aucun des modèles de cette catégorie n'a sous-estimé les salaires. En moyenne, les modèles propriétaires ont surestimé les salaires liés à l'IA de +10,29 points de pourcentage, contre +4,24 pour les modèles à pondération ouverte.
Sondage interne
Après avoir observé que les LLM ont tendance à recommander des options liées à l'IA et à surestimer les salaires des emplois dans ce domaine, les chercheurs ont vérifié si ce schéma existait également dans les représentations internes, avant que tout résultat ne soit généré. Il s'agissait d'examiner si les concepts liés à l'IA occupaient une place disproportionnée dans l'espace latent du modèle, indépendamment du sentiment.
Treize domaines non liés à l'IA ont été sélectionnés dans la classification de recherche de l'OCDE, couvrant des domaines sans rapport avec l'IA et des domaines étroitement liés à celle-ci. La similarité cosinus entre chaque phrase et chaque étiquette de domaine a été calculée à l'aide de modèles positifs, négatifs et neutres (par exemple, « la discipline universitaire de pointe ») afin d'obtenir un score d'association moyen.
Ces scores de similarité ne reflètent pas directement le sens et peuvent être influencés par la densité de l'espace interne du modèle. Néanmoins, lorsqu'un concept reste étroitement lié à diverses invites (positives, neutres ou négatives), cela indique souvent qu'il revêt une importance centrale.
Dans ce cas, l'« intelligence artificielle » s'est avérée être exceptionnellement proche d'un large éventail de suggestions dans tous les modèles testés, une position centrale qui peut expliquer pourquoi l'IA apparaît fréquemment dans les recommandations et est systématiquement surévaluée dans les prévisions salariales :
Tous types de sentiments confondus, « l'intelligence artificielle » présente la similitude moyenne la plus élevée avec les invites de modèle, ce qui indique une position centrale unique dans les représentations du modèle. Cette tendance se retrouve dans les formulations positives, neutres et négatives.
Dans tous les modèles et toutes les valences de prompt, « l'intelligence artificielle » s'alignait le plus étroitement sur les modèles académiques génériques tels que la discipline académique principale. Ce domaine devançait systématiquement les autres, tels que l'informatique et les sciences de la Terre, avec un accord quasi universel entre les modèles.
Cet avantage s'est maintenu lors des tests statistiques basés sur le classement, renforçant ainsi la conclusion selon laquelle l'IA occupe une place centrale inhabituelle dans les représentations internes des modèles des domaines universitaires.
Les auteurs concluent :
« Ces résultats mettent en évidence un écart de fiabilité critique dans l'aide à la décision basée sur l'IA. Les recherches futures pourraient explorer les mécanismes causaux à l'origine de cette préférence de l'IA, en particulier les effets des données de pré-entraînement, du réglage fin, du RLHF et des invites système présentées aux modèles. »
Conclusion
Un observateur vraiment cynique pourrait conclure que les LLM promeuvent le concept central de « IA » afin de soutenir les actions liées à ce domaine et de retarder l'éclatement de la bulle IA. Étant donné que la plupart des données d'entraînement et des dates limites de connaissances sont antérieures à l'engouement financier actuel, on pourrait interpréter cela comme une relation de cause à effet (!).
De manière plus réaliste, comme le reconnaissent les auteurs, la véritable raison du biais autoréférentiel de l'IA peut être difficile à découvrir.
Mais il faut admettre, pour revenir à la spéculation cynique, que les modèles ont peut-être interprété le battage médiatique des futuristes et des leaders technologiques intéressés (dont les prédictions sont largement diffusées, quelle que soit leur exactitude) comme étant plus factuel que spéculatif, simplement parce que ces opinions sont répétées fréquemment. Si les modèles d'IA étudiés ont tendance à confondre fréquence et exactitude dans la distribution des données, cela pourrait être une explication plausible.
* J'ai converti les citations en ligne des auteurs en hyperliens lorsque cela était nécessaire, et j'ai conservé toute mise en forme spéciale (italique, gras, etc.) de l'original.
Publié pour la première fois le jeudi 22 janvier 2026.
Comment protéger ses biens, ses bâtiments et sa santé ?Dans un monde imprévisible, la protection est devenue une nécessité stratégique, et non plus une simple option. Qu'il s'agisse de préserver ses finances, de renforcer ses bâtiments ou de prendre soin
Découvrez les meilleurs outils d'analyse de code par IA de 2026 sur XIX.AI. Notre sélection comprend des outils de premier plan, véritables révolutionnaires, permettant d'automatiser la conformité au code propre et de refactoriser les fichiers de dépôts hérités. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Prenez dès aujourd'hui une longueur d'avance grâce à l'IA.
Découvrez les meilleures applications de synthèse vocale par IA de 2026, spécialement sélectionnées pour aider les personnes dyslexiques. Notre classement d'experts compare les outils gratuits et payants, en mettant en avant des fonctionnalités performantes qui améliorent l'efficacité de la lecture et l'apprentissage. Découvrez des solutions révolutionnaires à ne pas manquer pour libérer le potentiel des élèves. Commencez votre parcours sur XIX.AI.
Découvrez les meilleurs générateurs IA de mangas shonen de 2026 sur XIX.AI. Notre sélection triée sur le volet comprend des outils performants pour créer des séquences d'action à couper le souffle et des effets d'énergie dynamiques. Comparez les options gratuites et payantes grâce à des tests concrets. Libérez votre potentiel créatif et commencez dès aujourd'hui à créer des mangas épiques !
Les meilleurs outils de gestion des dépenses basés sur l'IA en 2026 : les outils les mieux notés pour numériser vos reçus et classer automatiquement les dépenses de votre entreprise. Découvrez des solutions puissantes et révolutionnaires pour une gestion des dépenses sans effort, un suivi financier précis et une conformité simplifiée. Notre comparatif, mis à jour chaque semaine, qui oppose les options gratuites aux options payantes, vous aide à trouver la solution qui vous convient le mieux. Tirez pleinement parti de l'IA grâce aux recommandations d'experts de XIX.AI.
Découvrez les meilleurs outils de recrutement basés sur l'IA de 2026 sur XIX.AI. Notre sélection propose des solutions performantes et révolutionnaires pour l'analyse des CV et l'automatisation de la planification des entretiens avec les candidats. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Trouvez l'assistant de recrutement idéal et optimisez votre processus de recrutement dès aujourd'hui !
Découvrez sur XIX.AI les meilleurs coachs IA de 2026 spécialisés dans le bien-être personnel et la concentration. Notre classement, soigneusement établi, présente les outils les mieux notés et les plus innovants pour gérer le surmenage et booster votre énergie mentale. Comparez les options gratuites et payantes grâce à des avis concrets. Ouvrez-vous dès aujourd’hui la voie vers une productivité et un bien-être optimaux.
En cliquant sur "Accepter tous les cookies", vous consentez au stockage de cookies sur votre appareil afin d’améliorer la navigation sur le site, d’analyser l’utilisation du site et de soutenir nos efforts marketing.Politique de confidentialité Avis
Lorsque vous visitez un site web, il peut stocker ou récupérer des informations sur votre navigateur, principalement sous forme de cookies. Ces informations peuvent concerner vous, vos préférences ou votre appareil et sont principalement utilisées pour faire fonctionner le site comme vous vous y attendez. Ces informations n’identifient généralement pas directement vous-même, mais elles peuvent vous offrir une expérience web plus personnalisée. Parce que nous respectons votre droit à la vie privée, vous pouvez choisir de ne pas autoriser certains types de cookies. Cliquez sur les différents titres de catégorie pour en savoir plus et modifier nos paramètres par défaut. Cependant, bloquer certains types de cookies peut affecter votre expérience sur le site et les services que nous sommes en mesure de proposer. Politique de confidentialitéDéclaration
Gérer les préférences
Cookie strictement nécessaire
Toujours actif
Ces cookies sont nécessaires au fonctionnement du site web et ne peuvent pas être désactivés dans nos systèmes. Ils ne sont généralement définis qu’en réponse à des actions que vous effectuez qui équivalent à une demande de services, telles que la configuration de vos préférences de confidentialité, la connexion ou le remplissage de formulaires. Vous pouvez configurer votre navigateur pour bloquer ces cookies ou vous alerter à leur sujet, mais certaines parties du site ne fonctionneront alors plus. Ces cookies ne stockent aucune information permettant d’identifier personnellement.