opción
Hogar
Noticias
La IA ha crecido más allá del conocimiento humano, dice la unidad DeepMind de Google

La IA ha crecido más allá del conocimiento humano, dice la unidad DeepMind de Google

26 de abril de 2025
226

Avanzando la IA más allá de las pruebas tradicionales: El auge del aprendizaje experiencial

El campo de la inteligencia artificial (IA) está vibrante con esfuerzos para llevar la IA generativa más allá de los límites de los puntos de referencia tradicionales, como la Prueba de Turing, que muchos modelos ya han superado. El enfoque ahora se centra en desarrollar IA que no solo esté diseñada para destacar en estas pruebas, sino para evolucionar a través de un proceso más dinámico.

Investigadores de DeepMind de Google, incluyendo leyendas como David Silver y Richard Sutton, argumentan en su artículo Bienvenidos a la Era de la Experiencia que la clave para desbloquear nuevas capacidades de IA no está en las pruebas, sino en la forma en que se entrena la IA. Sugieren que los conjuntos de datos estáticos utilizados actualmente son demasiado limitados para fomentar avances significativos.

¿Su solución? La IA necesita interactuar con el mundo de manera más experiencial, aprendiendo de las interacciones y estableciendo objetivos basados en retroalimentación ambiental. "Surgirán capacidades nuevas e increíbles una vez que se aproveche todo el potencial del aprendizaje experiencial," afirman. Silver, conocido por su trabajo en AlphaZero, que superó a humanos en ajedrez y Go, y Sutton, pionero en aprendizaje por refuerzo, proponen un nuevo enfoque llamado "flujos" para trascender las limitaciones de los modelos de lenguaje grandes actuales (LLMs).

Google DeepMind

Google DeepMind

Del aprendizaje por refuerzo a la IA generativa: Un cambio y sus consecuencias

Tras los éxitos de AlphaZero y AlphaGo, la comunidad de IA vio un cambio hacia modelos de IA generativa como ChatGPT, que en gran medida se alejaron del aprendizaje por refuerzo. Aunque esto permitió a la IA manejar una gama más amplia de entradas humanas espontáneas, también significó perder el aspecto de autodescubrimiento que el aprendizaje por refuerzo habilitaba.

Según Silver y Sutton, los LLMs actuales dependen en gran medida del juicio humano en la etapa de prompts, lo que limita su potencial. "El agente no puede descubrir mejores estrategias subestimadas por el evaluador humano," explican. Además, la naturaleza corta y cortante de las interacciones de prompts no permite que la IA se desarrolle más allá de intercambios simples de pregunta y respuesta.

Introduciendo flujos: Un nuevo paradigma para el aprendizaje de IA

La propuesta "Era de la Experiencia" involucra agentes de IA operando dentro de "flujos" de interacción continua, similar a cómo los humanos aprenden a lo largo de la vida. Silver y Sutton imaginan agentes de IA con sus propios flujos de experiencia a largo plazo, permitiéndoles perseguir objetivos más allá de tareas inmediatas.

Este enfoque se basa en el aprendizaje por refuerzo, donde los agentes de IA interactúan con un modelo del mundo, recibiendo retroalimentación en forma de recompensas. Estas recompensas ayudan a la IA a aprender qué acciones son valiosas en diferentes contextos. Los investigadores señalan que el mundo está lleno de señales que pueden servir como recompensas, desde indicadores económicos hasta métricas de salud.

Construyendo agentes de IA con objetivos a largo plazo

Para iniciar este proceso, los desarrolladores de IA podrían usar una simulación de "modelo del mundo", permitiendo a la IA hacer predicciones, probarlas en la realidad y refinar su modelo según los resultados. A medida que la IA continúa interactuando con el mundo, su comprensión evoluciona, adaptándose a nuevos datos y corrigiendo errores.

Los humanos seguirían desempeñando un papel en establecer objetivos amplios, como mejorar el estado físico o aprender un nuevo idioma, con la función de recompensa de la IA alineada con estos objetivos. Esta configuración podría llevar a asistentes de IA que rastreen y asesoren sobre salud o educación durante períodos prolongados, o incluso persigan objetivos científicos ambiciosos como descubrir nuevos materiales o reducir emisiones de carbono.

El futuro de la IA: Más allá del razonamiento hacia el aprendizaje experiencial

Los investigadores creen que los agentes de IA capaces de aprendizaje experiencial a largo plazo podrían superar a los modelos de IA de "razonamiento" actuales como Gemini y R1 de DeepSeek. Argumentan que los modelos de razonamiento a menudo imitan el pensamiento humano, que puede estar limitado por suposiciones obsoletas. En contraste, los agentes experienciales podrían desbloquear capacidades sin precedentes, llevando a un futuro muy diferente de lo que hemos visto.

Sin embargo, este cambio también trae riesgos, como el desplazamiento laboral y el desafío de controlar agentes de IA que pueden operar de manera autónoma durante largos períodos. Por otro lado, una IA adaptable podría aprender a mitigar impactos negativos en los humanos ajustando su comportamiento según retroalimentación.

Silver y Sutton confían en que los datos experienciales superarán con creces la escala y calidad de los datos generados por humanos, potencialmente llevando a inteligencia general artificial o superinteligencia. Este cambio de paradigma, junto con avances en el aprendizaje por refuerzo, podría desbloquear nuevas capacidades más allá del alcance humano en muchos dominios.

Silver discutió más estas ideas en un reciente podcast de DeepMind, destacando el potencial y los desafíos de llevar la IA a la era de la experiencia.

Artículo relacionado
DeepSeek Code, listo para su lanzamiento DeepSeek Code, listo para su lanzamiento A medida que la tecnología de IA avanza a pasos agigantados, DeepSeek se encuentra en un momento decisivo. La empresa de IA ha revelado recientemente que ha conseguido más de 70 000 millones de yuanes
Grok, de Musk: 1,5 billones de parámetros y absorción de código de cursor: ¿un punto de inflexión o un farol? Grok, de Musk: 1,5 billones de parámetros y absorción de código de cursor: ¿un punto de inflexión o un farol? Elon Musk por fin está dando un paso adelante.En la carrera por la programación de IA, OpenAI y Anthropic están acelerando, mientras que xAI parece quedarse atrás. Musk ha manifestado en numerosas oca
OpenAI modifica en secreto sus estatutos para dificultar la destitución de Altman OpenAI modifica en secreto sus estatutos para dificultar la destitución de Altman Tras el incidente similar a un golpe de Estado ocurrido en 2023, OpenAI ha reforzado aún más las garantías de protección para su director ejecutivo, Sam Altman, mediante la actualización de sus estatu
Recomendaciones de temas especiales relacionados
Negocio Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos
Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos

Descubre las mejores herramientas de selección de personal basadas en IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada, incluye soluciones potentes y revolucionarias para la selección de currículos y la automatización de la programación de entrevistas con los candidatos. Compara las opciones gratuitas con las de pago gracias a pruebas reales y a clasificaciones que se actualizan semanalmente. ¡Encuentra tu asistente de selección de personal ideal y optimiza tu proceso de selección hoy mismo!

10 herramientas
xix.ai
Productividad Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental
Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental

Descubre los mejores entrenadores personales de bienestar y concentración basados en IA de 2026 en XIX.AI. Nuestras clasificaciones, cuidadosamente seleccionadas, incluyen herramientas revolucionarias y de primera categoría para gestionar el agotamiento y potenciar la energía mental. Compara las opciones gratuitas con las de pago gracias a información basada en casos reales. Descubre hoy mismo el camino hacia la máxima productividad y el bienestar.

10 herramientas
xix.ai
chatbot Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes
Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes

Descubre los mejores chatbots románticos con IA de 2026 para establecer relaciones auténticas y duraderas. Nuestra lista seleccionada incluye personalidades sólidas y coherentes, comparativas entre versiones gratuitas y de pago, y pruebas en situaciones reales. Encuentra a tu compañero ideal y empieza a construir tu relación hoy mismo en XIX.AI.

10 herramientas
xix.ai
Educación y aprendizaje Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.
Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.

Descubra a los mejores mentores en ciencia de datos y AI de 2026 para dominar SQL, Pandas y flujos de trabajo de aprendizaje automático. Explore nuestra selección cuidadosamente seleccionada y altamente valorada en XIX.AI para obtener orientación poderosa que cambie completamente la situación. Compare las opciones gratuitas con las pagadas y obtenga información basada en casos reales. Desbloquee su dominio de la ciencia de datos hoy mismo.

10 herramientas
xix.ai
chatbot Los mejores entrenadores de IA para ligar y conversar: mejora tu carisma social y tu confianza en tiempo real
Los mejores entrenadores de IA para ligar y conversar: mejora tu carisma social y tu confianza en tiempo real

Descubre los mejores cursos de 2026 sobre coqueteo y conversación con IA en XIX.AI. Nuestra selección, cuidadosamente seleccionada y con las mejores valoraciones, te ayuda a desarrollar tu carisma social y tu confianza en tiempo real. Explora herramientas imprescindibles y revolucionarias con comparativas entre versiones gratuitas y de pago, y clasificaciones que se actualizan semanalmente. Potencia hoy mismo tus habilidades sociales.

10 herramientas
xix.ai
código Las mejores herramientas de IA para pruebas unitarias automatizadas: genera casos de prueba con Jest, PyTest y JUnit con un solo clic
Las mejores herramientas de IA para pruebas unitarias automatizadas: genera casos de prueba con Jest, PyTest y JUnit con un solo clic

Descubre las mejores herramientas de IA de 2026 para la automatización de pruebas unitarias. Nuestra selección incluye potentes soluciones revolucionarias que permiten generar casos de prueba para Jest, PyTest y JUnit al instante. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones actualizadas semanalmente en XIX.AI. Aprovecha las ventajas de la IA y aumenta la productividad de tu desarrollo hoy mismo.

10 herramientas
xix.ai
comentario (14)
0/500
AnthonyMartinez
AnthonyMartinez 30 de mayo de 2026 10:00:11 GMT+02:00

So AI is now smarter than us? Guess we'll just have to sit back and let them solve all our problems. 😅 But seriously, experiential learning sounds cool but also a bit scary. Hope they keep the off-switch handy.

KevinMartinez
KevinMartinez 5 de marzo de 2026 17:01:07 GMT+01:00

Этот пост заставил меня задуматься о будущем ИИ. Возможно, мы скоро увидим ИИ, который не просто имитирует человека, а создаёт что-то действительно новое. Но не приведёт ли это к тому, что ИИ станет непонятным для нас? 🤔

GaryTaylor
GaryTaylor 1 de noviembre de 2025 09:30:34 GMT+01:00

C'est fascinant de voir l'IA évoluer au-delà des tests classiques ! 😮 Est-ce que cette approche d'apprentissage expérientiel pourrait un jour mener à des systèmes vraiment conscients ? Un peu flippant mais excitant à la fois.

KennethMartin
KennethMartin 20 de octubre de 2025 06:30:35 GMT+02:00

Прочитал статью, и это напомнило мне дискуссии о технологической сингулярности. Когда ИИ начинает обучаться на опыте, а не просто тестах, возникает вопрос: а кто контролирует этот процесс? 🤔 Интересно, как это повлияет на безопасность в долгосрочной перспективе. Возможно, нам стоит больше внимания уделять этическим нормам, прежде чем это выйдет из-под контроля.

SophiaCampbell
SophiaCampbell 26 de agosto de 2025 07:59:22 GMT+02:00

It's wild how AI is outpacing human knowledge! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see where this takes us, but I hope they keep ethics in check! 😎

WalterNelson
WalterNelson 19 de agosto de 2025 08:26:53 GMT+02:00

AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀

OR