opción
Hogar
Noticias
Deepmind's AI supera a los medallistas de oro de la OMI

Deepmind's AI supera a los medallistas de oro de la OMI

10 de abril de 2025
60

La última IA de Google Deepmind, Alphageometry2, ha realizado olas al superar al medallista de oro promedio para resolver problemas de geometría en la Olimpiada Matemática Internacional (IMO). Esta versión avanzada de la Alfageometría publicada anteriormente, presentada solo en enero pasado, según los informes, resolvió el 84% de los problemas de geometría de los últimos 25 años de competiciones de Imo.

Quizás se pregunte por qué DeepMind se está centrando en un concurso de matemáticas de la escuela secundaria. Bueno, creen que descifrar estos desafiantes problemas de geometría euclidiana podría ser un trampolín para desarrollar una IA más avanzada. Resolver estos problemas requiere un razonamiento lógico y la capacidad de navegar a través de diversas rutas de solución, habilidades que podrían ser cruciales para los futuros sistemas de IA de uso general.

Este verano, DeepMind mostró un sistema que combinó Alphageometry2 con Alphaproof, otro modelo de IA diseñado para un razonamiento matemático formal. Juntos, abordaron cuatro de seis problemas de la OMI de 2024. Este enfoque podría extenderse más allá de la geometría a otras áreas de matemáticas y ciencias, como los cálculos de ingeniería complejos.

Alphageometry2 funciona con algunos componentes clave, incluido un modelo de idioma de la familia Gemini de Google y un "motor simbólico". El modelo Gemini ayuda al motor simbólico, que aplica reglas matemáticas para encontrar soluciones, en la creación de pruebas factibles para los teoremas de geometría.

Un diagrama de geometría típico en la OMI.

Un diagrama típico de problemas de geometría en un examen de la OMI. Créditos de imagen: Google (se abre en una nueva ventana)

En la OMI, los problemas de geometría a menudo requieren agregar "construcciones" como puntos, líneas o círculos a diagramas antes de resolverlos. El modelo Gemini de Alphageometry2 predice qué construcciones podría ser útil, guiando el motor simbólico para hacer deducciones.

Así es como funciona: el modelo Gemini sugiere pasos y construcciones en un lenguaje matemático formal, que el motor luego verifica la consistencia lógica. Alphageometry2 utiliza un algoritmo de búsqueda para explorar múltiples rutas de solución simultáneamente y almacena hallazgos potencialmente útiles en una base de conocimiento compartida.

Un problema se considera "resuelto" cuando Alphageometry2 combina las sugerencias del modelo Gemini con los principios conocidos del motor simbólico para formar una prueba completa.

Debido a la escasez de datos de entrenamiento de geometría utilizable, DeepMind creó datos sintéticos para entrenar el modelo de lenguaje de Alphageometry2, generando más de 300 millones de teoremas y pruebas de complejidad variable.

El equipo de DeepMind probó Alphageometry2 en 45 problemas de geometría de competencias de la OMI que abarcan 2000 a 2024, que se expandieron a 50 problemas. Alphageometry2 resolvió 42 de estos, superando la puntuación medalista de oro promedio de 40.9.

Sin embargo, Alphageometry2 tiene sus limitaciones. Lucha con problemas que involucran un número variable de puntos, ecuaciones no lineales y desigualdades. Si bien no es la primera IA en alcanzar el rendimiento de nivel de oro en la geometría, es el primero en hacerlo con un conjunto de problemas tan grande.

Cuando se enfrenta a un conjunto más difícil de 29 problemas nominados a IMO que aún no han aparecido en las competiciones, Alphageometry2 solo pudo resolver 20.

Es probable que los resultados del estudio generen un mayor debate sobre el mejor enfoque para construir sistemas de IA. ¿Deberíamos centrarnos en la manipulación de los símbolos, donde la IA usa reglas para manipular los símbolos que representan el conocimiento, o en las redes neuronales, que imitan la estructura del cerebro humano y aprenden de los datos?

Alphageometry2 adopta un enfoque híbrido, que combina la arquitectura de la red neuronal del modelo Gemini con el motor simbólico basado en reglas.

Los partidarios de las redes neuronales argumentan que el comportamiento inteligente puede surgir de grandes cantidades de datos y energía informática. En contraste, los defensores simbólicos de IA creen que es más adecuado para codificar el conocimiento, el razonamiento a través de escenarios complejos y explicar soluciones.

Vince Conitzer, profesor de informática de la Universidad Carnegie Mellon especializado en IA, comentó sobre el contraste entre el impresionante progreso en puntos de referencia como el IMO y las luchas continuas de los modelos de idiomas con simples problemas de sentido común. Hizo hincapié en la necesidad de comprender mejor estos sistemas y los riesgos que plantean.

Alphageometry2 sugiere que combinar la manipulación de símbolos y las redes neuronales podría ser un camino prometedor a seguir en la búsqueda de IA generalizable. Curiosamente, el equipo de DeepMind descubrió que el modelo de lenguaje de Alphageometry2 podría generar soluciones parciales a los problemas sin la ayuda del motor simbólico, insinuando el potencial de que los modelos de idiomas se vuelvan autosuficientes en el futuro.

Sin embargo, el equipo señaló que hasta que mejore la velocidad del modelo de idioma y las alucinaciones se resuelven, herramientas como motores simbólicos seguirán siendo esenciales para las aplicaciones de matemáticas.

Artículo relacionado
억만장자들이 이번 주 AI 업데이트에서 일자리 자동화에 대해 논의하다 억만장자들이 이번 주 AI 업데이트에서 일자리 자동화에 대해 논의하다 안녕하세요, TechCrunch의 AI 뉴스레터에 다시 오신 것을 환영합니다! 아직 구독하지 않으셨다면, 매주 수요일마다 받은 편지함으로 바로 배달받을 수 있도록 여기를 클릭해 구독하세요.지난주에는 잠시 쉬었지만, 그럴만한 이유가 있었습니다—중국의 AI 회사 DeepSeek의 갑작스러운 급부상 덕분에 AI 뉴스 사이클이 뜨거웠습니다. 정신없는 시간이였지만,
NotebookLM 앱 출시: AI 기반 지식 도구 NotebookLM 앱 출시: AI 기반 지식 도구 NotebookLM 모바일 출시: 이제 Android와 iOS에서 만나는 AI 연구 보조 도구NotebookLM에 대한 여러분의 뜨거운 반응에 깊이 감사드립니다. 수백만 사용자가 복잡한 정보를 이해하는 필수 도구로 NotebookLM을 선택해주셨습니다. 하지만 가장 많이 받은 요청은 바로 "언제 모바일에서 사용할 수 있나
Imagen 4: 구글 최신 AI 이미지 생성기 Imagen 4: 구글 최신 AI 이미지 생성기 구글이 최신 이미지 생성 AI 모델 '이마젠 4(Imagen 4)'를 공개하며 전작 대비 향상된 시각적 경험을 약속했습니다. 이번 주 초 구글 I/O 2025에서 발표된 이 신형 모델은 품질과 다용도성 측면에서 큰 도약으로 평가받고 있습니다. 구글에 따르면 이마젠 4는 직물 표면, 물방울, 동물 털 같은 정교한 디테일 구
comentario (25)
0/200
HarryPerez
HarryPerez 12 de abril de 2025 00:00:00 GMT

DeepMind's AlphaGeometry2 beating IMO gold medalists is mind-blowing! It's amazing to see AI tackling such complex problems. But, does it really understand geometry, or is it just pattern matching? Either way, it's a huge step forward for AI in education!

JackSanchez
JackSanchez 12 de abril de 2025 00:00:00 GMT

DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて驚きです!AIがこんなに複雑な問題に取り組むのを見るのは素晴らしいです。でも、本当に幾何学を理解しているのか、それともただのパターンマッチングなのか?どちらにしても、教育におけるAIの大きな一歩ですね!

HenryJackson
HenryJackson 11 de abril de 2025 00:00:00 GMT

DeepMind의 AlphaGeometry2가 IMO 금메달리스트를 능가하다니 놀랍네요! AI가 이렇게 복잡한 문제를 다루는 걸 보는 건 정말 멋져요. 하지만 정말 기하학을 이해하는 건지, 아니면 단순히 패턴 매칭을 하는 건지 궁금해요. 어쨌든 교육에서의 AI 발전에 큰 걸음이에요!

HarryRoberts
HarryRoberts 11 de abril de 2025 00:00:00 GMT

O AlphaGeometry2 da DeepMind superar os medalhistas de ouro do IMO é impressionante! É incrível ver a IA lidando com problemas tão complexos. Mas, será que ela realmente entende geometria, ou é apenas correspondência de padrões? De qualquer forma, é um grande avanço para a IA na educação!

BillyRoberts
BillyRoberts 10 de abril de 2025 00:00:00 GMT

¡Que AlphaGeometry2 de DeepMind supere a los medallistas de oro del IMO es alucinante! Es increíble ver a la IA abordando problemas tan complejos. Pero, ¿realmente entiende la geometría, o solo está haciendo coincidencia de patrones? De cualquier manera, es un gran paso adelante para la IA en la educación!

AlbertHarris
AlbertHarris 14 de abril de 2025 00:00:00 GMT

DeepMind's AlphaGeometry2 is mind-blowing! It's solving geometry problems better than IMO gold medalists. I used it to help with my math homework and it was spot on! The only thing is, it's a bit too advanced for casual users like me. Still, it's a solid 4 out of 5. 📚

Volver arriba
OR