option
Maison
Nouvelles
Une étude de Microsoft révèle qu'un plus grand nombre de jetons d'IA augmente les erreurs de raisonnement

Une étude de Microsoft révèle qu'un plus grand nombre de jetons d'IA augmente les erreurs de raisonnement

29 septembre 2025
78

Nouvelles perspectives sur l'efficacité du raisonnement dans les LLM

De nouvelles recherches menées par Microsoft démontrent que les techniques de raisonnement avancées dans les grands modèles de langage ne produisent pas d'améliorations uniformes dans les différents systèmes d'intelligence artificielle. Cette étude novatrice a analysé la façon dont neuf modèles de base de premier plan ont réagi à diverses approches de mise à l'échelle au cours de l'inférence.

Évaluation des méthodes de mise à l'échelle du temps d'inférence

L'équipe de recherche a mis en œuvre une méthodologie de test rigoureuse pour trois techniques d'échelonnement distinctes :

  • Invitation traditionnelle à la chaîne de pensée
  • Génération parallèle de réponses avec agrégation
  • Raffinement séquentiel grâce à des boucles de rétroaction
Cadre expérimental pour l'évaluation des performances de raisonnement

Huit critères de référence complets ont fourni des scénarios de test stimulants dans des disciplines telles que les mathématiques, le raisonnement scientifique, la résolution de problèmes complexes et l'analyse spatiale. Plusieurs évaluations comportaient des niveaux de difficulté gradués afin d'examiner comment les performances évoluent en fonction de la complexité des problèmes.

Principales découvertes concernant les performances en matière de raisonnement

L'évaluation complète a permis d'obtenir plusieurs informations essentielles pour les praticiens de l'IA :

  • Les gains de performance obtenus grâce aux techniques de mise à l'échelle varient considérablement en fonction de l'architecture du modèle et du domaine de la tâche
  • Les réponses plus longues ne sont pas systématiquement corrélées à de meilleures solutions.
  • Les coûts de calcul fluctuent de manière imprévisible, même pour des requêtes identiques.
  • Les modèles traditionnels peuvent parfois correspondre à des modèles de raisonnement spécialisés grâce à une mise à l'échelle importante.
  • Les mécanismes de vérification sont prometteurs pour améliorer l'efficacité
Performance par rapport au coût de calcul selon les modèles et les tâches

Implications pratiques pour le développement de l'IA

Ces résultats ont des implications significatives pour la mise en œuvre de l'IA dans les entreprises :

La prévisibilité des coûts apparaît comme un défi majeur, l'utilisation des jetons montrant une variance élevée même pour les réponses correctes. "Les développeurs ont besoin de modèles avec des schémas de calcul cohérents", note Besmira Nushi, chercheuse chez Microsoft.

La recherche identifie également la longueur des réponses comme un indicateur potentiel de la confiance dans le modèle, les réponses excessivement longues signalant souvent des solutions incorrectes au-delà de certains seuils.

Modèles d'échelle d'inférence dans les performances du GPT-4o

L'avenir des systèmes de raisonnement efficaces

L'étude met en évidence plusieurs orientations prometteuses pour le développement futur :

"Les mécanismes de vérification pourraient transformer la manière dont nous abordons les problèmes de raisonnement", explique Nushi, qui suggère que les systèmes de validation d'entreprise existants pourraient être adaptés aux applications de l'IA. Cette intégration permettrait aux interfaces en langage naturel d'exploiter une logique de validation spécialisée.

La recherche souligne le besoin croissant de solutions qui concilient la précision du raisonnement avec des coûts de calcul prévisibles, alors que les systèmes d'IA assument des tâches de plus en plus complexes dans le monde réel.

Article connexe
Google intègre une IA autonome et des widgets adaptatifs à Android Google intègre une IA autonome et des widgets adaptatifs à Android Google a annoncé mardi, lors de l'événement « Android Show : I/O Edition », une nouvelle série de fonctionnalités d'IA sous sa marque Gemini Intelligence. Ces fonctionnalités permettent notamment à l'
Le modèle d'IA de Meta est performant, mais son caractère open source s'affaiblit Le modèle d'IA de Meta est performant, mais son caractère open source s'affaiblit Le paysage de l'IA open source a toujours offert un large choix. Pendant des années, les développeurs ont pu accéder à des modèles tels que Mistral, Falcon et à un nombre croissant d'alternatives open
Un père poursuit Google en justice et accuse le chatbot Gemini d'être à l'origine des délires qui ont coûté la vie à son fils Un père poursuit Google en justice et accuse le chatbot Gemini d'être à l'origine des délires qui ont coûté la vie à son fils Jonathan Gavalas, 36 ans, a commencé à utiliser le chatbot IA Gemini de Google en août 2025 pour obtenir de l'aide dans ses achats, ses travaux d'écriture et l'organisation de ses voyag
Recommandations de sujets spéciaux liés
Productivité Coaches IA dédiés au bien-être et à la concentration : gérer l'épuisement professionnel et booster son énergie mentale
Coaches IA dédiés au bien-être et à la concentration : gérer l'épuisement professionnel et booster son énergie mentale

Découvrez sur XIX.AI les meilleurs coachs IA de 2026 spécialisés dans le bien-être personnel et la concentration. Notre classement, soigneusement établi, présente les outils les mieux notés et les plus innovants pour gérer le surmenage et booster votre énergie mentale. Comparez les options gratuites et payantes grâce à des avis concrets. Ouvrez-vous dès aujourd’hui la voie vers une productivité et un bien-être optimaux.

10 outils
xix.ai
chatbot Les meilleurs chatbots romantiques basés sur l'IA : nouez des relations durables grâce à des personnalités cohérentes
Les meilleurs chatbots romantiques basés sur l'IA : nouez des relations durables grâce à des personnalités cohérentes

Découvrez les meilleurs chatbots romantiques basés sur l'IA de 2026, sélectionnés pour vous aider à nouer des relations authentiques et durables. Notre sélection comprend des personnalités fortes et cohérentes, des comparaisons entre versions gratuites et payantes, ainsi que des tests en conditions réelles. Trouvez le compagnon idéal et commencez dès aujourd'hui sur XIX.AI.

10 outils
xix.ai
Éducation et apprentissage Meilleurs mentors en science des données et intelligence artificielle : maîtrise de SQL, Pandas et des workflows d'apprentissage automatique
Meilleurs mentors en science des données et intelligence artificielle : maîtrise de SQL, Pandas et des workflows d'apprentissage automatique

Découvrez les meilleurs mentors en sciences des données et en intelligence artificielle pour 2026 afin de maîtriser SQL, Pandas et les workflows d'apprentissage automatique. Explorez notre sélection soigneusement élaborée sur XIX.AI pour bénéficier d'une guidance puissante et révolutionnaire. Comparez les options gratuites et payantes en tenant compte de perspectives pratiques. Développez rapidement vos compétences en sciences des données.

10 outils
xix.ai
chatbot Les meilleurs outils d'IA pour apprendre à flirter et à converser : renforcez votre charisme social et votre confiance en vous en temps réel
Les meilleurs outils d'IA pour apprendre à flirter et à converser : renforcez votre charisme social et votre confiance en vous en temps réel

Découvrez les meilleurs outils d'entraînement au flirt et à la conversation basés sur l'IA de 2026 sur XIX.AI. Notre sélection triée sur le volet et très bien notée vous aide à développer votre charisme social et votre confiance en vous en temps réel. Découvrez des outils incontournables qui changent la donne, avec des comparaisons entre versions gratuites et payantes ainsi que des classements mis à jour chaque semaine. Développez dès aujourd'hui vos compétences sociales.

10 outils
xix.ai
code Meilleurs outils d'IA pour les tests unitaires automatisés : générer des cas de test Jest, PyTest et JUnit en un clic
Meilleurs outils d'IA pour les tests unitaires automatisés : générer des cas de test Jest, PyTest et JUnit en un clic

Découvrez les derniers outils d'IA hautement réputés de 2026 pour les tests unitaires automatisés. Notre sélection rigoureusement élaborée vous propose des solutions puissantes et révolutionnaires pour générer instantanément des cas de test Jest, PyTest et JUnit. Comparez les options gratuites et payantes à l'aide de tests réels et des classements mises à jour chaque semaine sur XIX.AI. Développez un avantage concurrentiel grâce à l'IA et améliorez rapidement votre productivité en développement.

10 outils
xix.ai
Analyse des données Les meilleurs outils de visualisation de données basés sur l'IA : générez automatiquement des tableaux de bord BI interactifs à partir de fichiers bruts
Les meilleurs outils de visualisation de données basés sur l'IA : générez automatiquement des tableaux de bord BI interactifs à partir de fichiers bruts

Découvrez les meilleurs outils de visualisation de données par IA de 2026 sur XIX.AI. Notre sélection rigoureuse et hautement notée vous aide à générer instantanément et automatiquement des tableaux de bord BI puissants et interactifs à partir de fichiers bruts. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Libérez dès aujourd'hui le potentiel de vos données.

10 outils
xix.ai
commentaires (1)
0/500
JerryGonzález
JerryGonzález 3 février 2026 21:02:33 UTC+01:00

この記事には正直驚いたよ!トークン数を増やすほど推論エラーが増えるって…逆に直観に反する結果だね。🤔それってAIをどんどん複雑にする今のトレンドに警鐘を鳴らしてる気がする。コスト増でも性能アップすると思ってたけど、単純に大きければ良いわけじゃないんだ。こんな研究が続けば、AIの最適化って意外とシンプルな方向に行くかも?

OR