La IA ha crecido más allá del conocimiento humano, dice la unidad DeepMind de Google

Hogar

Noticias

26 de abril de 2025

JuanLewis

133

Avanzando la IA más allá de las pruebas tradicionales: El auge del aprendizaje experiencial

El campo de la inteligencia artificial (IA) está vibrante con esfuerzos para llevar la IA generativa más allá de los límites de los puntos de referencia tradicionales, como la Prueba de Turing, que muchos modelos ya han superado. El enfoque ahora se centra en desarrollar IA que no solo esté diseñada para destacar en estas pruebas, sino para evolucionar a través de un proceso más dinámico.

Investigadores de DeepMind de Google, incluyendo leyendas como David Silver y Richard Sutton, argumentan en su artículo Bienvenidos a la Era de la Experiencia que la clave para desbloquear nuevas capacidades de IA no está en las pruebas, sino en la forma en que se entrena la IA. Sugieren que los conjuntos de datos estáticos utilizados actualmente son demasiado limitados para fomentar avances significativos.

¿Su solución? La IA necesita interactuar con el mundo de manera más experiencial, aprendiendo de las interacciones y estableciendo objetivos basados en retroalimentación ambiental. "Surgirán capacidades nuevas e increíbles una vez que se aproveche todo el potencial del aprendizaje experiencial," afirman. Silver, conocido por su trabajo en AlphaZero, que superó a humanos en ajedrez y Go, y Sutton, pionero en aprendizaje por refuerzo, proponen un nuevo enfoque llamado "flujos" para trascender las limitaciones de los modelos de lenguaje grandes actuales (LLMs).

Google DeepMind

Del aprendizaje por refuerzo a la IA generativa: Un cambio y sus consecuencias

Tras los éxitos de AlphaZero y AlphaGo, la comunidad de IA vio un cambio hacia modelos de IA generativa como ChatGPT, que en gran medida se alejaron del aprendizaje por refuerzo. Aunque esto permitió a la IA manejar una gama más amplia de entradas humanas espontáneas, también significó perder el aspecto de autodescubrimiento que el aprendizaje por refuerzo habilitaba.

Según Silver y Sutton, los LLMs actuales dependen en gran medida del juicio humano en la etapa de prompts, lo que limita su potencial. "El agente no puede descubrir mejores estrategias subestimadas por el evaluador humano," explican. Además, la naturaleza corta y cortante de las interacciones de prompts no permite que la IA se desarrolle más allá de intercambios simples de pregunta y respuesta.

Introduciendo flujos: Un nuevo paradigma para el aprendizaje de IA

La propuesta "Era de la Experiencia" involucra agentes de IA operando dentro de "flujos" de interacción continua, similar a cómo los humanos aprenden a lo largo de la vida. Silver y Sutton imaginan agentes de IA con sus propios flujos de experiencia a largo plazo, permitiéndoles perseguir objetivos más allá de tareas inmediatas.

Este enfoque se basa en el aprendizaje por refuerzo, donde los agentes de IA interactúan con un modelo del mundo, recibiendo retroalimentación en forma de recompensas. Estas recompensas ayudan a la IA a aprender qué acciones son valiosas en diferentes contextos. Los investigadores señalan que el mundo está lleno de señales que pueden servir como recompensas, desde indicadores económicos hasta métricas de salud.

Construyendo agentes de IA con objetivos a largo plazo

Para iniciar este proceso, los desarrolladores de IA podrían usar una simulación de "modelo del mundo", permitiendo a la IA hacer predicciones, probarlas en la realidad y refinar su modelo según los resultados. A medida que la IA continúa interactuando con el mundo, su comprensión evoluciona, adaptándose a nuevos datos y corrigiendo errores.

Los humanos seguirían desempeñando un papel en establecer objetivos amplios, como mejorar el estado físico o aprender un nuevo idioma, con la función de recompensa de la IA alineada con estos objetivos. Esta configuración podría llevar a asistentes de IA que rastreen y asesoren sobre salud o educación durante períodos prolongados, o incluso persigan objetivos científicos ambiciosos como descubrir nuevos materiales o reducir emisiones de carbono.

El futuro de la IA: Más allá del razonamiento hacia el aprendizaje experiencial

Los investigadores creen que los agentes de IA capaces de aprendizaje experiencial a largo plazo podrían superar a los modelos de IA de "razonamiento" actuales como Gemini y R1 de DeepSeek. Argumentan que los modelos de razonamiento a menudo imitan el pensamiento humano, que puede estar limitado por suposiciones obsoletas. En contraste, los agentes experienciales podrían desbloquear capacidades sin precedentes, llevando a un futuro muy diferente de lo que hemos visto.

Sin embargo, este cambio también trae riesgos, como el desplazamiento laboral y el desafío de controlar agentes de IA que pueden operar de manera autónoma durante largos períodos. Por otro lado, una IA adaptable podría aprender a mitigar impactos negativos en los humanos ajustando su comportamiento según retroalimentación.

Silver y Sutton confían en que los datos experienciales superarán con creces la escala y calidad de los datos generados por humanos, potencialmente llevando a inteligencia general artificial o superinteligencia. Este cambio de paradigma, junto con avances en el aprendizaje por refuerzo, podría desbloquear nuevas capacidades más allá del alcance humano en muchos dominios.

Silver discutió más estas ideas en un reciente podcast de DeepMind, destacando el potencial y los desafíos de llevar la IA a la era de la experiencia.

Artículo relacionado

Eleve sus imágenes con HitPaw AI Photo Enhancer: Guía completa ¿Quiere transformar su experiencia de edición de fotos? Gracias a la inteligencia artificial de vanguardia, mejorar sus imágenes ahora es effortless. Esta guía detallada explora el HitPaw AI Photo Enh

Creación de Música con IA: Crea Canciones y Videos sin Esfuerzo La creación de música puede ser compleja, requiriendo tiempo, recursos y experiencia. La inteligencia artificial ha transformado este proceso, haciéndolo simple y accesible. Esta guía destaca cómo la

Creación de Libros para Colorear Impulsados por IA: Una Guía Completa Diseñar libros para colorear es una actividad gratificante que combina la expresión artística con experiencias relajantes para los usuarios. Sin embargo, el proceso puede ser intensivo en trabajo. Afo

comentario (9)

0/200

Entregar

WalterNelson

19 de agosto de 2025 08:26:53 GMT+02:00

AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀

ScottWalker

15 de agosto de 2025 17:00:59 GMT+02:00

AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀

AlbertGarcía

8 de agosto de 2025 04:00:59 GMT+02:00

Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?

FrankSanchez

28 de julio de 2025 03:20:02 GMT+02:00

This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!

CarlGarcia

27 de abril de 2025 20:31:27 GMT+02:00

AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!

PaulTaylor

27 de abril de 2025 17:12:58 GMT+02:00

¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!

Noticias principales

Gemini 2.5 Pro ahora ilimitado y más barato que Claude, GPT-4O Generadores de Video AI Top de 2025: Pika Labs vs Alternativas Doblaje AI: Guía Definitiva para la Creación de Voz Realista Operai mejora el asistente de voz de IA para mejores chats Cómo garantizar que sus datos sean confiables para la integración de IA Notebooklm se expande a nivel mundial, agrega diapositivas y verificación de hechos mejorada Los ajustes a los centros de datos de EE. UU. Podrían desbloquear 76 GW de nueva capacidad de potencia La IA de Cambium transforma la madera de los desechos en madera AI Computing para consumir la potencia de múltiples NYC para 2026, dice el fundador Clonación de Voz IA: La guía definitiva para dominar la conversión de voz

Más

Presentado