AI Scholars otorgó el premio Turing por técnica detrás de la victoria de ajedrez de Alphago

Hogar

Noticias

18 de abril de 2025

KeithSmith

200

AI Scholars otorgó el premio Turing por técnica detrás de la victoria de ajedrez de Alphago

En la última década, la inteligencia artificial nos ha deslumbrado con sus avances, particularmente a través de una técnica en la que las computadoras toman decisiones aleatorias y aprenden de los resultados. Este método, conocido como aprendizaje por refuerzo, ha sido fundamental para lograr hazañas notables en la IA.

Toma como ejemplo el programa AlphaZero de Google DeepMind de 2016, que para 2018 había dominado los complejos juegos de ajedrez, shogi y Go. De manera similar, AlphaStar utilizó este enfoque para alcanzar el nivel de "gran maestro" en el videojuego *Starcraft II*. Estos logros destacan el poder del aprendizaje por refuerzo.

El miércoles, el campo celebró un hito significativo cuando dos académicos de IA fueron honrados por su trabajo innovador en el avance del aprendizaje por refuerzo. Andrew G. Barto, profesor emérito de la Universidad de Massachusetts, Amherst, y Richard S. Sutton, profesor de la Universidad de Alberta, Canadá, recibieron el prestigioso Premio Turing 2025 de la Asociación para la Maquinaria de Computación (ACM).

Reconocimiento a los pioneros en el aprendizaje por refuerzo

La ACM elogió a Barto y Sutton por sentar las bases del aprendizaje por refuerzo, afirmando que "introdujeron las ideas principales, construyeron los fundamentos matemáticos y desarrollaron algoritmos importantes." Este galardón, que incluye un premio de $1 millón, es frecuentemente considerado el equivalente en la industria informática a un Premio Nobel.

El aprendizaje por refuerzo puede compararse con un ratón que navega por un laberinto para encontrar queso. El ratón aprende qué caminos conducen al progreso y cuáles a callejones sin salida. De manera similar, los neurocientíficos creen que los seres inteligentes, como los ratones, desarrollan un "modelo interno del mundo" para guiar sus acciones.

Sutton y Barto propusieron que las computadoras también podrían desarrollar tales modelos internos. En el aprendizaje por refuerzo, la computadora recopila datos sobre su entorno —ya sea un laberinto o un tablero de ajedrez— y actúa inicialmente de manera aleatoria. Recibe retroalimentación en forma de recompensas o penalizaciones, lo que le ayuda a estimar los resultados de diferentes acciones. Con base en estas estimaciones, el programa desarrolla una "política" para guiar decisiones futuras, equilibrando la exploración de nuevas acciones con la explotación de las ya conocidas como exitosas.

El papel de la exploración y la explotación

En su esencia, el aprendizaje por refuerzo requiere un delicado equilibrio entre explorar nuevas posibilidades y explotar estrategias conocidas. Ningún enfoque por sí solo es suficiente para el éxito.

Para aquellos interesados en profundizar, el libro de texto de 2018 de Sutton y Barto sobre el tema es un recurso valioso.

Es importante señalar que el término "aprendizaje por refuerzo" a veces se usa de manera diferente por empresas como OpenAI, que emplean el "aprendizaje por refuerzo con retroalimentación humana" (RLHF) para refinar las salidas de modelos de lenguaje grandes como GPT. Sin embargo, esto es distinto del método desarrollado por Sutton y Barto.

El aprendizaje por refuerzo como una teoría del pensamiento

Sutton, quien fue Investigador Distinguido en DeepMind de 2017 a 2023, ha argumentado que el aprendizaje por refuerzo no es solo una técnica, sino una "teoría del pensamiento." Ha expresado preocupación por la falta de una teoría computacional en la IA, afirmando que "el aprendizaje por refuerzo es la primera teoría computacional de la inteligencia."

Más allá de sus aplicaciones técnicas, el aprendizaje por refuerzo también puede arrojar luz sobre la creatividad y el juego libre como expresiones de la inteligencia. Sutton y Barto han destacado el papel del juego en el aprendizaje, sugiriendo que la curiosidad impulsa la exploración. Sutton ha enfatizado que el juego puede implicar establecer metas que no sean inmediatamente útiles, pero que podrían resultar beneficiosas más adelante.

"El juego es algo grande," comentó Sutton, indicando su papel significativo en el contexto más amplio del aprendizaje y la inteligencia.

El viaje del aprendizaje por refuerzo, desde su trabajo fundacional por Barto y Sutton hasta su aplicación en juegos y más allá, continúa empujando los límites de lo que la IA puede lograr.

Artículo relacionado

La valoración de 5.300 millones de dólares de Runway desafía a Google, mientras la IA aplicada al vídeo supera a la del lenguaje Mientras que la mayoría de los gigantes de la IA han invertido miles de millones en modelos de lenguaje, la startup de vídeo generativo con IA Runway avanza a toda velocidad por un camino muy diferent

Google aumentará su inversión en Anthropic; la inversión total podría ascender a 40 000 millones de dólares En la vertiginosa carrera armamentística de la IA, las grandes empresas tecnológicas están dando pasos cada vez más audaces. Según los últimos informes, Google tiene previsto invertir hasta 10 000 mil

Se lanza Maia 3, un motor de ajedrez de IA de código abierto y gratuito, para mejorar la experiencia de juego de los humanos El equipo de Maia Chess ha lanzado un nuevo motor de ajedrez de código abierto, Maia 3, entrenado con 250 millones de partidas reales jugadas por humanos. Alcanza una puntuación Elo de unos 1800 punto

Recomendaciones de temas especiales relacionados

Salud y bienestar

Asistentes de IA para el embarazo: genera planes seguros de entrenamiento y nutrición trimestre a trimestre

Descubre los mejores asistentes de IA para el embarazo de 2026, que te ofrecen planes de entrenamiento y nutrición seguros y personalizados trimestre a trimestre. Obtén recomendaciones cuidadosamente seleccionadas y con las mejores valoraciones, con comparativas entre opciones gratuitas y de pago, y opiniones reales. Disfruta de un embarazo más saludable con la guía de expertos de XIX.AI. Explora ahora.

10 herramientas

xix.ai

escribiendo

Los mejores generadores de texto gratuitos e indetectables por la IA: convierte borradores robóticos en prosa natural y de estilo humano

Descubre los mejores generadores de texto con IA indetectables y gratuitos de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, te ayuda a transformar borradores robóticos en prosa natural y de estilo humano. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones que se actualizan semanalmente. Aprovecha hoy mismo las ventajas de la escritura con IA.

10 herramientas

xix.ai

Edición de imágenes

Generadores de arte por IA para guiones de cortometrajes: Personajes de fantasía y romance urbano

2026 Últimas novedades: Descubra los mejores generadores de arte por IA para guiones de historias cortas. Nuestra lista seleccionada incluye las herramientas más valoradas para crear personajes fascinantes de fantasía y romance urbano. Compare opciones gratuitas y pagas, vea resultados de pruebas reales y encuentre el compañero creativo perfecto para usted. Reciba clasificaciones actualizadas semanalmente y opiniones de expertos de XIX.AI. ¡Comience a visualizar su historia hoy mismo!

10 herramientas

xix.ai

escribiendo

Los mejores herramientas de scripting AI para la radio y los podcasts: Crea anuncios de audio atractivos.

Descubra los mejores herramientas de scripting de IA para la radio y los podcasts en 2026 en XIX.AI. Nuestra lista seleccionada y altamente valorada incluye soluciones poderosas que cambiarán completamente la forma en que crea anuncios de audio atractivos. Compare opciones gratuitas y pagadas mediante pruebas reales y clasificaciones actualizadas semanalmente. ¡Despliegue todo su potencial creativo hoy mismo!

10 herramientas

xix.ai

Negocio

El mejor software de revisión de contratos con IA: detecta al instante las lagunas legales y los riesgos de cumplimiento normativo

Descubre el mejor software de revisión de contratos con IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada y con las mejores valoraciones, incluye potentes herramientas que detectan al instante las lagunas legales y los riesgos de cumplimiento normativo. Compara las opciones gratuitas con las de pago gracias a pruebas en condiciones reales y a clasificaciones que se actualizan semanalmente. Encuentra la solución revolucionaria que necesitas para un análisis de contratos seguro y eficiente. Explora ahora la guía definitiva.

10 herramientas

xix.ai

Creación de animación

Generador de anime AI para Donghua: Crea personajes para novelas web y avatares para cómics

Descubra los mejores generadores de anime de IA para donghua en 2026. Nuestra lista seleccionada y calificada incluye herramientas poderosas para crear increíbles personajes para novelas web y avatares de cómics. Compare opciones gratuitas y pagadas a través de pruebas reales. Encuentre su compañero creativo ideal y dé vida a sus historias hoy mismo en XIX.AI.

10 herramientas

xix.ai

comentario (12)

0/500

Inicie sesión primero

NicholasAdams

16 de agosto de 2025 13:00:59 GMT+02:00

This reinforcement learning stuff is wild! AlphaGo beating chess champs? Mind blown 🤯. Makes me wonder how far AI can push human limits—scary but exciting!

GeorgeTaylor

10 de agosto de 2025 21:00:59 GMT+02:00

Mind-blowing how reinforcement learning led to AlphaGo's chess win! 🤯 Makes me wonder what other games AI will conquer next.

ArthurBrown

22 de abril de 2025 00:39:03 GMT+02:00

The AI Scholars Awarded Turing Prize really blew my mind! The way they used reinforcement learning to make AlphaGo win at chess is just genius. It's like watching a sci-fi movie come to life. I wish I understood the tech better, but it's still super cool! 🤓

EdwardTaylor

21 de abril de 2025 06:00:52 GMT+02:00

AlphaGoのチェス勝利の背後にある技術でAI Scholarsがチューリング賞を受賞したのは驚きです！強化学習がAIをこれほどの高みに押し上げたのを見るのは魅力的です。ただ、時々技術的な内容が難しすぎることがありますが、それでも人間の創意工夫の証です。境界を押し広げ続けてください！🧠

WalterSanchez

21 de abril de 2025 03:09:05 GMT+02:00

The AI Scholars winning the Turing Prize for the technique behind AlphaGo's chess victory is mind-blowing! It's fascinating to see how reinforcement learning has propelled AI to such heights. The only thing is, it's a bit too technical for me at times, but still, it's a testament to human ingenuity. Keep pushing the boundaries! 🧠

WillieJackson

20 de abril de 2025 11:42:21 GMT+02:00

¡Los académicos de IA que recibieron el Premio Turing por la técnica detrás de la victoria de AlphaGo en el ajedrez me dejaron asombrado! Usar el aprendizaje por refuerzo para ganar es genial. Me gustaría entender mejor la tecnología, pero aún así es muy cool! 🤓

Noticias principales

AI Builder y Power Automate Revolucionan la Sumarización de Documentos Los anfitriones de AI del podcast Notebooklm ahora están disponibles para entrevistas China presenta su robot humanoide nacional y sus estándares de inteligencia incorporada Los datos de Ramp revelan un estancamiento en la adopción de la IA por parte de las empresas Guía de creación de arte con el creador de imágenes de Bing Aprende a crear música de IA usando tu voz: un tutorial de Suno paso a paso iMyFone MagicMic: Revisión y Tutorial de Cambio de Voz AI en Tiempo Real Generadores de Video AI Top de 2025: Pika Labs vs Alternativas Embodied Intelligence presenta la primera norma del sector para frenar el crecimiento descontrolado DeepSeek V4 surge como un revolucionario sistema de IA multimodal

Más

Presentado