option
Maison
Nouvelles
L'IA a grandi au-delà des connaissances humaines, dit l'unité DeepMind de Google

L'IA a grandi au-delà des connaissances humaines, dit l'unité DeepMind de Google

26 avril 2025
226

Faire progresser l'IA au-delà des tests traditionnels : l'essor de l'apprentissage expérientiel

Le domaine de l'intelligence artificielle (AI) est en effervescence avec des efforts pour pousser l'IA générative au-delà des limites des benchmarks traditionnels, comme le test de Turing, que de nombreux modèles ont déjà dépassé. L'accent est désormais mis sur le développement d'une IA qui n'est pas seulement conçue pour exceller dans ces tests, mais pour évoluer à travers un processus plus dynamique.

Les chercheurs de DeepMind de Google, y compris des légendes comme David Silver et Richard Sutton, soutiennent dans leur article Bienvenue dans l'ère de l'expérience que la clé pour débloquer de nouvelles capacités de l'IA ne réside pas dans les tests, mais dans la manière dont l'IA est entraînée. Ils suggèrent que les ensembles de données statiques actuellement utilisés sont trop limités pour favoriser des avancées significatives.

Leur solution ? L'IA doit interagir avec le monde de manière plus expérientielle, en apprenant des interactions et en fixant des objectifs basés sur les retours de l'environnement. « Des capacités nouvelles incroyables émergeront une fois que le plein potentiel de l'apprentissage expérientiel sera exploité », affirment-ils. Silver, connu pour son travail sur AlphaZero, qui a surpassé les humains aux échecs et au Go, et Sutton, pionnier de l'apprentissage par renforcement, proposent une nouvelle approche appelée « flux » pour transcender les limites des modèles de langage actuels (LLMs).

Google DeepMind

Google DeepMind

De l'apprentissage par renforcement à l'IA générative : un changement et ses conséquences

Après les succès d'AlphaZero et d'AlphaGo, la communauté de l'IA a vu un virage vers les modèles d'IA générative comme ChatGPT, qui se sont largement éloignés de l'apprentissage par renforcement. Bien que cela ait permis à l'IA de gérer une plus large gamme d'entrées humaines spontanées, cela a également signifié la perte de l'aspect de découverte de soi que l'apprentissage par renforcement permettait.

Selon Silver et Sutton, les LLMs actuels dépendent fortement du jugement humain à l'étape des prompts, ce qui limite leur potentiel. « L'agent ne peut pas découvrir de meilleures stratégies sous-estimées par l'évaluateur humain », expliquent-ils. De plus, la nature courte et fragmentée des interactions par prompt ne permet pas à l'IA de se développer au-delà des simples échanges de questions et réponses.

Introduction des flux : un nouveau paradigme pour l'apprentissage de l'IA

L'« ère de l'expérience » proposée implique des agents IA opérant dans des « flux » d'interaction continue, un peu comme les humains apprennent tout au long de leur vie. Silver et Sutton imaginent des agents IA avec leurs propres flux d'expérience à long terme, leur permettant de poursuivre des objectifs au-delà des tâches immédiates.

Cette approche s'appuie sur l'apprentissage par renforcement, où les agents IA interagissent avec un modèle du monde, recevant des retours sous forme de récompenses. Ces récompenses aident l'IA à apprendre quelles actions sont précieuses dans différents contextes. Les chercheurs soulignent que le monde est riche en signaux qui peuvent servir de récompenses, des indicateurs économiques aux métriques de santé.

Construire des agents IA avec des objectifs à long terme

Pour lancer ce processus, les développeurs d'IA pourraient utiliser une simulation de « modèle du monde », permettant à l'IA de faire des prédictions, de les tester dans la réalité et de raffiner son modèle en fonction des résultats. À mesure que l'IA continue d'interagir avec le monde, sa compréhension évolue, s'adaptant aux nouvelles données et corrigeant les erreurs.

Les humains joueraient encore un rôle dans la définition d'objectifs généraux, comme améliorer la condition physique ou apprendre une nouvelle langue, avec la fonction de récompense de l'IA alignée sur ces objectifs. Ce cadre pourrait mener à des assistants IA qui suivent et conseillent sur la santé ou l'éducation sur de longues périodes, ou même poursuivent des objectifs scientifiques ambitieux comme découvrir de nouveaux matériaux ou réduire les émissions de carbone.

L'avenir de l'IA : au-delà du raisonnement vers l'apprentissage expérientiel

Les chercheurs estiment que les agents IA capables d'apprentissage expérientiel à long terme pourraient surpasser les modèles d'IA de « raisonnement » actuels comme Gemini et R1 de DeepSeek. Ils soutiennent que les modèles de raisonnement imitent souvent la pensée humaine, qui peut être limitée par des hypothèses dépassées. En revanche, les agents expérientiels pourraient débloquer des capacités sans précédent, menant à un avenir très différent de ce que nous avons vu.

Cependant, ce changement apporte également des risques, tels que le déplacement d'emplois et le défi de contrôler des agents IA capables d'opérer de manière autonome sur de longues périodes. D'un autre côté, une IA adaptable pourrait apprendre à atténuer les impacts négatifs sur les humains en ajustant son comportement en fonction des retours.

Silver et Sutton sont confiants que les données expérientielles dépasseront de loin l'ampleur et la qualité des données générées par les humains, pouvant potentiellement mener à une intelligence artificielle générale ou à une super-intelligence. Ce changement de paradigme, couplé aux avancées dans l'apprentissage par renforcement, pourrait débloquer de nouvelles capacités hors de portée humaine dans de nombreux domaines.

Silver a approfondi ces idées dans un récent podcast de DeepMind, mettant en lumière le potentiel et les défis de faire entrer l'IA dans l'ère de l'expérience.

Article connexe
DeepSeek Code s'apprête à être lancé DeepSeek Code s'apprête à être lancé Alors que les technologies d'IA progressent à grands pas, DeepSeek se trouve à un tournant passionnant. L'entreprise spécialisée dans l'IA a récemment annoncé avoir levé plus de 70 milliards de yuans.
Grok de Musk : 1 500 milliards de paramètres et intégration du code du curseur — Une véritable révolution ou un simple coup de bluff ? Grok de Musk : 1 500 milliards de paramètres et intégration du code du curseur — Une véritable révolution ou un simple coup de bluff ? Elon Musk passe enfin à l'action.Dans la course à la programmation de l'IA, OpenAI et Anthropic accélèrent, tandis que xAI semble à la traîne. Musk a souvent affirmé son objectif de rivaliser avec Cla
OpenAI modifie discrètement ses statuts pour compliquer le licenciement d'Altman OpenAI modifie discrètement ses statuts pour compliquer le licenciement d'Altman À la suite de l'incident de 2023, qui s'apparentait à un coup d'État, OpenAI a encore renforcé les protections dont bénéficie son PDG, Sam Altman, en mettant à jour ses statuts. Des doc
Recommandations de sujets spéciaux liés
Entreprise Les meilleurs outils de recrutement basés sur l'IA : triez les CV et automatisez la planification des entretiens avec les candidats
Les meilleurs outils de recrutement basés sur l'IA : triez les CV et automatisez la planification des entretiens avec les candidats

Découvrez les meilleurs outils de recrutement basés sur l'IA de 2026 sur XIX.AI. Notre sélection propose des solutions performantes et révolutionnaires pour l'analyse des CV et l'automatisation de la planification des entretiens avec les candidats. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Trouvez l'assistant de recrutement idéal et optimisez votre processus de recrutement dès aujourd'hui !

10 outils
xix.ai
Productivité Coaches IA dédiés au bien-être et à la concentration : gérer l'épuisement professionnel et booster son énergie mentale
Coaches IA dédiés au bien-être et à la concentration : gérer l'épuisement professionnel et booster son énergie mentale

Découvrez sur XIX.AI les meilleurs coachs IA de 2026 spécialisés dans le bien-être personnel et la concentration. Notre classement, soigneusement établi, présente les outils les mieux notés et les plus innovants pour gérer le surmenage et booster votre énergie mentale. Comparez les options gratuites et payantes grâce à des avis concrets. Ouvrez-vous dès aujourd’hui la voie vers une productivité et un bien-être optimaux.

10 outils
xix.ai
chatbot Les meilleurs chatbots romantiques basés sur l'IA : nouez des relations durables grâce à des personnalités cohérentes
Les meilleurs chatbots romantiques basés sur l'IA : nouez des relations durables grâce à des personnalités cohérentes

Découvrez les meilleurs chatbots romantiques basés sur l'IA de 2026, sélectionnés pour vous aider à nouer des relations authentiques et durables. Notre sélection comprend des personnalités fortes et cohérentes, des comparaisons entre versions gratuites et payantes, ainsi que des tests en conditions réelles. Trouvez le compagnon idéal et commencez dès aujourd'hui sur XIX.AI.

10 outils
xix.ai
Éducation et apprentissage Meilleurs mentors en science des données et intelligence artificielle : maîtrise de SQL, Pandas et des workflows d'apprentissage automatique
Meilleurs mentors en science des données et intelligence artificielle : maîtrise de SQL, Pandas et des workflows d'apprentissage automatique

Découvrez les meilleurs mentors en sciences des données et en intelligence artificielle pour 2026 afin de maîtriser SQL, Pandas et les workflows d'apprentissage automatique. Explorez notre sélection soigneusement élaborée sur XIX.AI pour bénéficier d'une guidance puissante et révolutionnaire. Comparez les options gratuites et payantes en tenant compte de perspectives pratiques. Développez rapidement vos compétences en sciences des données.

10 outils
xix.ai
chatbot Les meilleurs outils d'IA pour apprendre à flirter et à converser : renforcez votre charisme social et votre confiance en vous en temps réel
Les meilleurs outils d'IA pour apprendre à flirter et à converser : renforcez votre charisme social et votre confiance en vous en temps réel

Découvrez les meilleurs outils d'entraînement au flirt et à la conversation basés sur l'IA de 2026 sur XIX.AI. Notre sélection triée sur le volet et très bien notée vous aide à développer votre charisme social et votre confiance en vous en temps réel. Découvrez des outils incontournables qui changent la donne, avec des comparaisons entre versions gratuites et payantes ainsi que des classements mis à jour chaque semaine. Développez dès aujourd'hui vos compétences sociales.

10 outils
xix.ai
code Meilleurs outils d'IA pour les tests unitaires automatisés : générer des cas de test Jest, PyTest et JUnit en un clic
Meilleurs outils d'IA pour les tests unitaires automatisés : générer des cas de test Jest, PyTest et JUnit en un clic

Découvrez les derniers outils d'IA hautement réputés de 2026 pour les tests unitaires automatisés. Notre sélection rigoureusement élaborée vous propose des solutions puissantes et révolutionnaires pour générer instantanément des cas de test Jest, PyTest et JUnit. Comparez les options gratuites et payantes à l'aide de tests réels et des classements mises à jour chaque semaine sur XIX.AI. Développez un avantage concurrentiel grâce à l'IA et améliorez rapidement votre productivité en développement.

10 outils
xix.ai
commentaires (14)
0/500
AnthonyMartinez
AnthonyMartinez 30 mai 2026 10:00:11 UTC+02:00

So AI is now smarter than us? Guess we'll just have to sit back and let them solve all our problems. 😅 But seriously, experiential learning sounds cool but also a bit scary. Hope they keep the off-switch handy.

KevinMartinez
KevinMartinez 5 mars 2026 17:01:07 UTC+01:00

Этот пост заставил меня задуматься о будущем ИИ. Возможно, мы скоро увидим ИИ, который не просто имитирует человека, а создаёт что-то действительно новое. Но не приведёт ли это к тому, что ИИ станет непонятным для нас? 🤔

GaryTaylor
GaryTaylor 1 novembre 2025 09:30:34 UTC+01:00

C'est fascinant de voir l'IA évoluer au-delà des tests classiques ! 😮 Est-ce que cette approche d'apprentissage expérientiel pourrait un jour mener à des systèmes vraiment conscients ? Un peu flippant mais excitant à la fois.

KennethMartin
KennethMartin 20 octobre 2025 06:30:35 UTC+02:00

Прочитал статью, и это напомнило мне дискуссии о технологической сингулярности. Когда ИИ начинает обучаться на опыте, а не просто тестах, возникает вопрос: а кто контролирует этот процесс? 🤔 Интересно, как это повлияет на безопасность в долгосрочной перспективе. Возможно, нам стоит больше внимания уделять этическим нормам, прежде чем это выйдет из-под контроля.

SophiaCampbell
SophiaCampbell 26 août 2025 07:59:22 UTC+02:00

It's wild how AI is outpacing human knowledge! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see where this takes us, but I hope they keep ethics in check! 😎

WalterNelson
WalterNelson 19 août 2025 08:26:53 UTC+02:00

AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀

OR