opción
Hogar
Noticias
El AI de DeepMind Gana Oro en la Olimpiada de Matemáticas 2025

El AI de DeepMind Gana Oro en la Olimpiada de Matemáticas 2025

22 de agosto de 2025
0

El AI de DeepMind ha logrado un avance impresionante en razonamiento matemático, obteniendo una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO) 2025, solo un año después de ganar plata en 2024. Este hito destaca la creciente capacidad del AI para resolver problemas complejos y abstractos que requieren creatividad similar a la humana. Este artículo explora el viaje transformador de DeepMind, los avances técnicos clave y el impacto más amplio de este logro.

Por qué importa la IMO

Desde 1959, la Olimpiada Internacional de Matemáticas ha sido la principal competencia mundial de matemáticas para estudiantes de secundaria. Desafía a los participantes con seis problemas intrincados en álgebra, geometría, teoría de números y combinatoria, que exigen una creatividad excepcional, lógica y pruebas elegantes.

Para el AI, la IMO es una prueba formidable. A diferencia del reconocimiento de patrones o juegos estratégicos como el Go, las matemáticas de la Olimpiada requieren razonamiento abstracto y síntesis de ideas novedosas, habilidades consideradas exclusivamente humanas durante mucho tiempo. Por lo tanto, la IMO sirve como un punto de referencia para el progreso del AI hacia una inteligencia similar a la humana.

El hito de la medalla de plata de 2024

En 2024, DeepMind presentó dos sistemas de AI para los problemas de la IMO: AlphaProof y AlphaGeometry 2, ambos aprovechando el AI "neuro-simólico", combinando modelos de lenguaje grandes (LLMs) con lógica simbólica.

AlphaProof utilizó Lean, un lenguaje matemático formal, para probar enunciados. Integró Gemini, el LLM de DeepMind, con AlphaZero, un sistema de aprendizaje por refuerzo famoso por dominar juegos de mesa. Gemini tradujo problemas a Lean, generando pasos lógicos, mientras que AlphaProof se entrenó con millones de problemas matemáticos diversos, refinando sus habilidades mediante auto-mejora.

AlphaGeometry 2 destacó en geometría, con Gemini prediciendo construcciones auxiliares y un motor simbólico manejando deducciones. Este enfoque híbrido le permitió resolver problemas geométricos complejos.

Los sistemas resolvieron cuatro de los seis problemas de la IMO: dos en álgebra, uno en teoría de números y uno en geometría, obteniendo 28/42 puntos, lo que les valió una medalla de plata. Esto marcó un logro histórico para el AI, aunque dependió de traducciones humanas y amplios recursos computacionales.

Innovaciones clave para el oro

El salto de DeepMind al oro en 2025 provino de avances técnicos significativos.

1. Pruebas en lenguaje natural

Un cambio crucial fue el uso de lenguaje natural para las pruebas, eliminando la necesidad de traducciones expertas a lenguajes formales. Una versión mejorada de Gemini con capacidades Deep Think procesa problemas directamente, esbozando pruebas informales, formalizando pasos clave internamente y entregando pruebas claras en inglés. El aprendizaje por refuerzo con retroalimentación humana (RLHF) aseguró soluciones concisas y lógicas.

Gemini Deep Think destaca por ventanas de contexto más largas y más tokens de cómputo, soportando razonamientos de varias páginas. Emplea razonamiento paralelo, generando cientos de caminos de solución, con un supervisor clasificando los mejores, similar al brainstorming humano.

2. Técnicas de entrenamiento avanzadas

Gemini Deep Think fue ajustado con un corpus de 100,000 soluciones de foros de matemáticas, arXiv y conjuntos de problemas universitarios, con mentores humanos filtrando errores. El aprendizaje por refuerzo con recompensas por pasos verificados de sub-lemas guio al modelo hacia pruebas concisas. El entrenamiento abarcó tres meses, utilizando 25 millones de horas de TPU.

3. Poder de procesamiento paralelo

La paralelización fue crítica, explorando múltiples ramas de razonamiento simultáneamente. Los recursos se desplazaron dinámicamente a caminos prometedores, especialmente efectivos para combinatoria. Este enfoque, respaldado por los clústeres TPU v5 de DeepMind, reflejó estrategias humanas como probar desigualdades antes de pruebas completas.

El triunfo de DeepMind en la IMO 2025

Para garantizar la equidad, DeepMind congeló los pesos de su modelo tres semanas antes de la IMO, filtrando soluciones de problemas no publicados. Durante el evento, Gemini Deep Think abordó seis problemas en texto plano sin acceso a internet, usando una potencia de cómputo equivalente a una laptop. Completó las pruebas en menos de tres horas, obteniendo puntajes perfectos en cinco problemas y un total de 35/42, asegurando el oro. Las pruebas del AI fueron elogiadas como rigurosas y exhaustivas, equiparándose a los estándares humanos.

Impacto en el AI y las matemáticas

El éxito de DeepMind señala el progreso del AI hacia la inteligencia general artificial (AGI), ya que los problemas de la IMO exigen un razonamiento avanzado. Para las matemáticas, herramientas de AI como Gemini Deep Think pueden ayudar a explorar nuevos teoremas, verificar conjeturas y optimizar pruebas, liberando a los matemáticos para trabajos conceptuales. Sin embargo, el rol del AI en la educación y las competencias plantea preguntas sobre su estructura futura.

Perspectivas futuras

Aunque persisten algunos desafíos matemáticos, el rápido progreso de DeepMind sugiere que el AI podría pronto abordar problemas no resueltos importantes. La victoria en la IMO 2025 destaca el avance del razonamiento lógico del AI, generando debate sobre si complementará o redefinirá la creatividad humana en las matemáticas.

Artículo relacionado
Creador de Paralaje Potenciado por IA: Crea Animaciones Dinámicas 2.5D Creador de Paralaje Potenciado por IA: Crea Animaciones Dinámicas 2.5D Transforma imágenes estáticas en animaciones 2.5D cautivadoras con Parallax Maker. Esta herramienta de código abierto permite a artistas y desarrolladores de juegos añadir profundidad y movimiento a s
Herramientas Trunk Asegura $40M para Avanzar en Soluciones de Construcción Impulsadas por IA Herramientas Trunk Asegura $40M para Avanzar en Soluciones de Construcción Impulsadas por IA Herramientas Trunk, un innovador en IA que transforma cómo los profesionales de la construcción gestionan y utilizan datos de proyectos, ha recaudado $40 millones en una ronda Serie B. Liderada por In
Publicidad Inmobiliaria Impulsada por IA: Mejorando la Calidad de los Prospectos con Likely AI Publicidad Inmobiliaria Impulsada por IA: Mejorando la Calidad de los Prospectos con Likely AI En el mercado inmobiliario acelerado de hoy, la diferenciación es clave. El Creador de Anuncios de Likely AI transforma el marketing utilizando inteligencia artificial para crear campañas publicitaria
comentario (0)
0/200
Volver arriba
OR