L'IA a grandi au-delà des connaissances humaines, dit l'unité DeepMind de Google

Maison

Nouvelles

26 avril 2025

JuanLewis

133

Faire progresser l'IA au-delà des tests traditionnels : l'essor de l'apprentissage expérientiel

Le domaine de l'intelligence artificielle (AI) est en effervescence avec des efforts pour pousser l'IA générative au-delà des limites des benchmarks traditionnels, comme le test de Turing, que de nombreux modèles ont déjà dépassé. L'accent est désormais mis sur le développement d'une IA qui n'est pas seulement conçue pour exceller dans ces tests, mais pour évoluer à travers un processus plus dynamique.

Les chercheurs de DeepMind de Google, y compris des légendes comme David Silver et Richard Sutton, soutiennent dans leur article Bienvenue dans l'ère de l'expérience que la clé pour débloquer de nouvelles capacités de l'IA ne réside pas dans les tests, mais dans la manière dont l'IA est entraînée. Ils suggèrent que les ensembles de données statiques actuellement utilisés sont trop limités pour favoriser des avancées significatives.

Leur solution ? L'IA doit interagir avec le monde de manière plus expérientielle, en apprenant des interactions et en fixant des objectifs basés sur les retours de l'environnement. « Des capacités nouvelles incroyables émergeront une fois que le plein potentiel de l'apprentissage expérientiel sera exploité », affirment-ils. Silver, connu pour son travail sur AlphaZero, qui a surpassé les humains aux échecs et au Go, et Sutton, pionnier de l'apprentissage par renforcement, proposent une nouvelle approche appelée « flux » pour transcender les limites des modèles de langage actuels (LLMs).

Google DeepMind

De l'apprentissage par renforcement à l'IA générative : un changement et ses conséquences

Après les succès d'AlphaZero et d'AlphaGo, la communauté de l'IA a vu un virage vers les modèles d'IA générative comme ChatGPT, qui se sont largement éloignés de l'apprentissage par renforcement. Bien que cela ait permis à l'IA de gérer une plus large gamme d'entrées humaines spontanées, cela a également signifié la perte de l'aspect de découverte de soi que l'apprentissage par renforcement permettait.

Selon Silver et Sutton, les LLMs actuels dépendent fortement du jugement humain à l'étape des prompts, ce qui limite leur potentiel. « L'agent ne peut pas découvrir de meilleures stratégies sous-estimées par l'évaluateur humain », expliquent-ils. De plus, la nature courte et fragmentée des interactions par prompt ne permet pas à l'IA de se développer au-delà des simples échanges de questions et réponses.

Introduction des flux : un nouveau paradigme pour l'apprentissage de l'IA

L'« ère de l'expérience » proposée implique des agents IA opérant dans des « flux » d'interaction continue, un peu comme les humains apprennent tout au long de leur vie. Silver et Sutton imaginent des agents IA avec leurs propres flux d'expérience à long terme, leur permettant de poursuivre des objectifs au-delà des tâches immédiates.

Cette approche s'appuie sur l'apprentissage par renforcement, où les agents IA interagissent avec un modèle du monde, recevant des retours sous forme de récompenses. Ces récompenses aident l'IA à apprendre quelles actions sont précieuses dans différents contextes. Les chercheurs soulignent que le monde est riche en signaux qui peuvent servir de récompenses, des indicateurs économiques aux métriques de santé.

Construire des agents IA avec des objectifs à long terme

Pour lancer ce processus, les développeurs d'IA pourraient utiliser une simulation de « modèle du monde », permettant à l'IA de faire des prédictions, de les tester dans la réalité et de raffiner son modèle en fonction des résultats. À mesure que l'IA continue d'interagir avec le monde, sa compréhension évolue, s'adaptant aux nouvelles données et corrigeant les erreurs.

Les humains joueraient encore un rôle dans la définition d'objectifs généraux, comme améliorer la condition physique ou apprendre une nouvelle langue, avec la fonction de récompense de l'IA alignée sur ces objectifs. Ce cadre pourrait mener à des assistants IA qui suivent et conseillent sur la santé ou l'éducation sur de longues périodes, ou même poursuivent des objectifs scientifiques ambitieux comme découvrir de nouveaux matériaux ou réduire les émissions de carbone.

L'avenir de l'IA : au-delà du raisonnement vers l'apprentissage expérientiel

Les chercheurs estiment que les agents IA capables d'apprentissage expérientiel à long terme pourraient surpasser les modèles d'IA de « raisonnement » actuels comme Gemini et R1 de DeepSeek. Ils soutiennent que les modèles de raisonnement imitent souvent la pensée humaine, qui peut être limitée par des hypothèses dépassées. En revanche, les agents expérientiels pourraient débloquer des capacités sans précédent, menant à un avenir très différent de ce que nous avons vu.

Cependant, ce changement apporte également des risques, tels que le déplacement d'emplois et le défi de contrôler des agents IA capables d'opérer de manière autonome sur de longues périodes. D'un autre côté, une IA adaptable pourrait apprendre à atténuer les impacts négatifs sur les humains en ajustant son comportement en fonction des retours.

Silver et Sutton sont confiants que les données expérientielles dépasseront de loin l'ampleur et la qualité des données générées par les humains, pouvant potentiellement mener à une intelligence artificielle générale ou à une super-intelligence. Ce changement de paradigme, couplé aux avancées dans l'apprentissage par renforcement, pourrait débloquer de nouvelles capacités hors de portée humaine dans de nombreux domaines.

Silver a approfondi ces idées dans un récent podcast de DeepMind, mettant en lumière le potentiel et les défis de faire entrer l'IA dans l'ère de l'expérience.

Article connexe

Traducteur Vocal IA G5 Pro : Communication Mondiale Fluide Dans un monde où la connectivité mondiale est essentielle, combler les écarts linguistiques est plus important que jamais. Le Traducteur Vocal IA G5 Pro offre une solution pratique avec ses fonctionna

Élevez Vos Images avec HitPaw AI Photo Enhancer : Un Guide Complet Voulez-vous transformer votre expérience d'édition de photos ? Grâce à une intelligence artificielle de pointe, améliorer vos images est désormais sans effort. Ce guide détaillé explore le HitPaw AI P

Création musicale alimentée par l'IA : Créez des chansons et des vidéos sans effort La création musicale peut être complexe, nécessitant du temps, des ressources et une expertise. L'intelligence artificielle a transformé ce processus, le rendant simple et accessible. Ce guide montre

commentaires (9)

0/200

Soumettre

WalterNelson

19 août 2025 08:26:53 UTC+02:00

AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀

ScottWalker

15 août 2025 17:00:59 UTC+02:00

AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀

AlbertGarcía

8 août 2025 04:00:59 UTC+02:00

Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?

FrankSanchez

28 juillet 2025 03:20:02 UTC+02:00

This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!

CarlGarcia

27 avril 2025 20:31:27 UTC+02:00

AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!

PaulTaylor

27 avril 2025 17:12:58 UTC+02:00

¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!

Top nouvelles

Gemini 2.5 Pro maintenant illimité et moins cher que Claude, GPT-4O Meilleurs Générateurs de Vidéos IA en 2025 : Pika Labs vs Alternatives Doublage par IA : Guide ultime pour la création de voix réalistes OpenAI améliore l'assistant vocal AI pour de meilleurs chats Comment vous assurer que vos données sont dignes de confiance pour l'intégration de l'IA Notebooklm se développe à l'échelle mondiale, ajoute des diapositives et une vérification des faits améliorée Les ajustements aux centres de données américains pourraient débloquer 76 GW de nouvelle capacité d'énergie L'IA du cambium transforme le bois de déchet en bois L'informatique de l'IA pour consommer la puissance de plusieurs New York d'ici 2026, explique le fondateur Clonage Vocal IA: Guide Ultime pour Maîtriser la Conversion de Voix

Plus

En vedette