El AI de DeepMind Gana Oro en la Olimpiada de Matemáticas 2025
El AI de DeepMind ha logrado un avance impresionante en razonamiento matemático, obteniendo una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO) 2025, solo un año después de ganar plata en 2024. Este hito destaca la creciente capacidad del AI para resolver problemas complejos y abstractos que requieren creatividad similar a la humana. Este artículo explora el viaje transformador de DeepMind, los avances técnicos clave y el impacto más amplio de este logro.
Por qué importa la IMO
Desde 1959, la Olimpiada Internacional de Matemáticas ha sido la principal competencia mundial de matemáticas para estudiantes de secundaria. Desafía a los participantes con seis problemas intrincados en álgebra, geometría, teoría de números y combinatoria, que exigen una creatividad excepcional, lógica y pruebas elegantes.
Para el AI, la IMO es una prueba formidable. A diferencia del reconocimiento de patrones o juegos estratégicos como el Go, las matemáticas de la Olimpiada requieren razonamiento abstracto y síntesis de ideas novedosas, habilidades consideradas exclusivamente humanas durante mucho tiempo. Por lo tanto, la IMO sirve como un punto de referencia para el progreso del AI hacia una inteligencia similar a la humana.
El hito de la medalla de plata de 2024
En 2024, DeepMind presentó dos sistemas de AI para los problemas de la IMO: AlphaProof y AlphaGeometry 2, ambos aprovechando el AI "neuro-simólico", combinando modelos de lenguaje grandes (LLMs) con lógica simbólica.
AlphaProof utilizó Lean, un lenguaje matemático formal, para probar enunciados. Integró Gemini, el LLM de DeepMind, con AlphaZero, un sistema de aprendizaje por refuerzo famoso por dominar juegos de mesa. Gemini tradujo problemas a Lean, generando pasos lógicos, mientras que AlphaProof se entrenó con millones de problemas matemáticos diversos, refinando sus habilidades mediante auto-mejora.
AlphaGeometry 2 destacó en geometría, con Gemini prediciendo construcciones auxiliares y un motor simbólico manejando deducciones. Este enfoque híbrido le permitió resolver problemas geométricos complejos.
Los sistemas resolvieron cuatro de los seis problemas de la IMO: dos en álgebra, uno en teoría de números y uno en geometría, obteniendo 28/42 puntos, lo que les valió una medalla de plata. Esto marcó un logro histórico para el AI, aunque dependió de traducciones humanas y amplios recursos computacionales.
Innovaciones clave para el oro
El salto de DeepMind al oro en 2025 provino de avances técnicos significativos.
1. Pruebas en lenguaje natural
Un cambio crucial fue el uso de lenguaje natural para las pruebas, eliminando la necesidad de traducciones expertas a lenguajes formales. Una versión mejorada de Gemini con capacidades Deep Think procesa problemas directamente, esbozando pruebas informales, formalizando pasos clave internamente y entregando pruebas claras en inglés. El aprendizaje por refuerzo con retroalimentación humana (RLHF) aseguró soluciones concisas y lógicas.
Gemini Deep Think destaca por ventanas de contexto más largas y más tokens de cómputo, soportando razonamientos de varias páginas. Emplea razonamiento paralelo, generando cientos de caminos de solución, con un supervisor clasificando los mejores, similar al brainstorming humano.
2. Técnicas de entrenamiento avanzadas
Gemini Deep Think fue ajustado con un corpus de 100,000 soluciones de foros de matemáticas, arXiv y conjuntos de problemas universitarios, con mentores humanos filtrando errores. El aprendizaje por refuerzo con recompensas por pasos verificados de sub-lemas guio al modelo hacia pruebas concisas. El entrenamiento abarcó tres meses, utilizando 25 millones de horas de TPU.
3. Poder de procesamiento paralelo
La paralelización fue crítica, explorando múltiples ramas de razonamiento simultáneamente. Los recursos se desplazaron dinámicamente a caminos prometedores, especialmente efectivos para combinatoria. Este enfoque, respaldado por los clústeres TPU v5 de DeepMind, reflejó estrategias humanas como probar desigualdades antes de pruebas completas.
El triunfo de DeepMind en la IMO 2025
Para garantizar la equidad, DeepMind congeló los pesos de su modelo tres semanas antes de la IMO, filtrando soluciones de problemas no publicados. Durante el evento, Gemini Deep Think abordó seis problemas en texto plano sin acceso a internet, usando una potencia de cómputo equivalente a una laptop. Completó las pruebas en menos de tres horas, obteniendo puntajes perfectos en cinco problemas y un total de 35/42, asegurando el oro. Las pruebas del AI fueron elogiadas como rigurosas y exhaustivas, equiparándose a los estándares humanos.
Impacto en el AI y las matemáticas
El éxito de DeepMind señala el progreso del AI hacia la inteligencia general artificial (AGI), ya que los problemas de la IMO exigen un razonamiento avanzado. Para las matemáticas, herramientas de AI como Gemini Deep Think pueden ayudar a explorar nuevos teoremas, verificar conjeturas y optimizar pruebas, liberando a los matemáticos para trabajos conceptuales. Sin embargo, el rol del AI en la educación y las competencias plantea preguntas sobre su estructura futura.
Perspectivas futuras
Aunque persisten algunos desafíos matemáticos, el rápido progreso de DeepMind sugiere que el AI podría pronto abordar problemas no resueltos importantes. La victoria en la IMO 2025 destaca el avance del razonamiento lógico del AI, generando debate sobre si complementará o redefinirá la creatividad humana en las matemáticas.
Artículo relacionado
Xiaohongshu se reestructura: Conan es nombrado presidente y crea el departamento principal de IA «Dots» y la división internacional «Rednote»
El 30 de abril, Xiaohongshu envió una nota interna a todos los empleados en la que anunciaba el lanzamiento de una nueva reestructuración organizativa. El núcleo de este cambio consiste en integrar pl
El juego «Xiaolongxia» de Tencent supera todas las expectativas; el equipo multiplica por diez su capacidad, pide disculpas y ofrece compensaciones
Tencent ha lanzado oficialmente WorkBuddy, un agente inteligente basado en IA para todo tipo de situaciones, lo que marca una nueva etapa en la carrera por la capa de aplicación de los modelos a gran
El principal inversor de Suno: eliminar las publicaciones no tapará el agujero de la demanda por derechos de autor
La tan esperada plataforma de generación musical con IA, Suno, se enfrenta a una dura batalla por los derechos de autor, y un comentario sincero de su principal inversor podría haber proporcionado a l
Recomendaciones de temas especiales relacionados
comentario (1)
0/500
El AI de DeepMind ha logrado un avance impresionante en razonamiento matemático, obteniendo una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO) 2025, solo un año después de ganar plata en 2024. Este hito destaca la creciente capacidad del AI para resolver problemas complejos y abstractos que requieren creatividad similar a la humana. Este artículo explora el viaje transformador de DeepMind, los avances técnicos clave y el impacto más amplio de este logro.
Por qué importa la IMO
Desde 1959, la Olimpiada Internacional de Matemáticas ha sido la principal competencia mundial de matemáticas para estudiantes de secundaria. Desafía a los participantes con seis problemas intrincados en álgebra, geometría, teoría de números y combinatoria, que exigen una creatividad excepcional, lógica y pruebas elegantes.
Para el AI, la IMO es una prueba formidable. A diferencia del reconocimiento de patrones o juegos estratégicos como el Go, las matemáticas de la Olimpiada requieren razonamiento abstracto y síntesis de ideas novedosas, habilidades consideradas exclusivamente humanas durante mucho tiempo. Por lo tanto, la IMO sirve como un punto de referencia para el progreso del AI hacia una inteligencia similar a la humana.
El hito de la medalla de plata de 2024
En 2024, DeepMind presentó dos sistemas de AI para los problemas de la IMO: AlphaProof y AlphaGeometry 2, ambos aprovechando el AI "neuro-simólico", combinando modelos de lenguaje grandes (LLMs) con lógica simbólica.
AlphaProof utilizó Lean, un lenguaje matemático formal, para probar enunciados. Integró Gemini, el LLM de DeepMind, con AlphaZero, un sistema de aprendizaje por refuerzo famoso por dominar juegos de mesa. Gemini tradujo problemas a Lean, generando pasos lógicos, mientras que AlphaProof se entrenó con millones de problemas matemáticos diversos, refinando sus habilidades mediante auto-mejora.
AlphaGeometry 2 destacó en geometría, con Gemini prediciendo construcciones auxiliares y un motor simbólico manejando deducciones. Este enfoque híbrido le permitió resolver problemas geométricos complejos.
Los sistemas resolvieron cuatro de los seis problemas de la IMO: dos en álgebra, uno en teoría de números y uno en geometría, obteniendo 28/42 puntos, lo que les valió una medalla de plata. Esto marcó un logro histórico para el AI, aunque dependió de traducciones humanas y amplios recursos computacionales.
Innovaciones clave para el oro
El salto de DeepMind al oro en 2025 provino de avances técnicos significativos.
1. Pruebas en lenguaje natural
Un cambio crucial fue el uso de lenguaje natural para las pruebas, eliminando la necesidad de traducciones expertas a lenguajes formales. Una versión mejorada de Gemini con capacidades Deep Think procesa problemas directamente, esbozando pruebas informales, formalizando pasos clave internamente y entregando pruebas claras en inglés. El aprendizaje por refuerzo con retroalimentación humana (RLHF) aseguró soluciones concisas y lógicas.
Gemini Deep Think destaca por ventanas de contexto más largas y más tokens de cómputo, soportando razonamientos de varias páginas. Emplea razonamiento paralelo, generando cientos de caminos de solución, con un supervisor clasificando los mejores, similar al brainstorming humano.
2. Técnicas de entrenamiento avanzadas
Gemini Deep Think fue ajustado con un corpus de 100,000 soluciones de foros de matemáticas, arXiv y conjuntos de problemas universitarios, con mentores humanos filtrando errores. El aprendizaje por refuerzo con recompensas por pasos verificados de sub-lemas guio al modelo hacia pruebas concisas. El entrenamiento abarcó tres meses, utilizando 25 millones de horas de TPU.
3. Poder de procesamiento paralelo
La paralelización fue crítica, explorando múltiples ramas de razonamiento simultáneamente. Los recursos se desplazaron dinámicamente a caminos prometedores, especialmente efectivos para combinatoria. Este enfoque, respaldado por los clústeres TPU v5 de DeepMind, reflejó estrategias humanas como probar desigualdades antes de pruebas completas.
El triunfo de DeepMind en la IMO 2025
Para garantizar la equidad, DeepMind congeló los pesos de su modelo tres semanas antes de la IMO, filtrando soluciones de problemas no publicados. Durante el evento, Gemini Deep Think abordó seis problemas en texto plano sin acceso a internet, usando una potencia de cómputo equivalente a una laptop. Completó las pruebas en menos de tres horas, obteniendo puntajes perfectos en cinco problemas y un total de 35/42, asegurando el oro. Las pruebas del AI fueron elogiadas como rigurosas y exhaustivas, equiparándose a los estándares humanos.
Impacto en el AI y las matemáticas
El éxito de DeepMind señala el progreso del AI hacia la inteligencia general artificial (AGI), ya que los problemas de la IMO exigen un razonamiento avanzado. Para las matemáticas, herramientas de AI como Gemini Deep Think pueden ayudar a explorar nuevos teoremas, verificar conjeturas y optimizar pruebas, liberando a los matemáticos para trabajos conceptuales. Sin embargo, el rol del AI en la educación y las competencias plantea preguntas sobre su estructura futura.
Perspectivas futuras
Aunque persisten algunos desafíos matemáticos, el rápido progreso de DeepMind sugiere que el AI podría pronto abordar problemas no resueltos importantes. La victoria en la IMO 2025 destaca el avance del razonamiento lógico del AI, generando debate sobre si complementará o redefinirá la creatividad humana en las matemáticas.
Xiaohongshu se reestructura: Conan es nombrado presidente y crea el departamento principal de IA «Dots» y la división internacional «Rednote»
El 30 de abril, Xiaohongshu envió una nota interna a todos los empleados en la que anunciaba el lanzamiento de una nueva reestructuración organizativa. El núcleo de este cambio consiste en integrar pl
El juego «Xiaolongxia» de Tencent supera todas las expectativas; el equipo multiplica por diez su capacidad, pide disculpas y ofrece compensaciones
Tencent ha lanzado oficialmente WorkBuddy, un agente inteligente basado en IA para todo tipo de situaciones, lo que marca una nueva etapa en la carrera por la capa de aplicación de los modelos a gran
El principal inversor de Suno: eliminar las publicaciones no tapará el agujero de la demanda por derechos de autor
La tan esperada plataforma de generación musical con IA, Suno, se enfrenta a una dura batalla por los derechos de autor, y un comentario sincero de su principal inversor podría haber proporcionado a l





Hogar






