Hogar
La IA vence en las Olimpiadas, pero tiene dificultades con las matemáticas escolares básicas

El año 2025 marcó un hito notable cuando los sistemas Google DeepMind y OpenAI obtuvieron medallas de oro en la Olimpiada Internacional de Matemáticas. Estos modelos de IA resolvieron problemas que normalmente solo resuelven algunos de los jóvenes matemáticos más brillantes del mundo. Sin embargo, estos mismos sistemas tropiezan a menudo con problemas aritméticos básicos que cualquier estudiante de secundaria podría resolver. Esta sorprendente paradoja revela algo fundamental sobre la IA contemporánea: estamos asistiendo a la aparición de una inteligencia irregular, en la que las máquinas muestran una capacidad sobrehumana en dominios específicos mientras fracasan en tareas que consideramos elementales.
El triunfo de la Olimpiada
La Olimpiada Matemática Internacional representa la cumbre de la competición matemática preuniversitaria. Cada año, los mejores estudiantes se enfrentan a seis problemas que requieren un profundo conocimiento, creatividad y técnicas de demostración avanzadas. En 2025, las IA de Google DeepMind y OpenAI obtuvieron 35 de 42 puntos, lo que les valió la medalla de oro. AlphaGeometry 2 de DeepMind resolvió un complejo problema de geometría en solo 19 segundos, mientras que AlphaProof abordó problemas de teoría numérica y álgebra que dejaron perplejos a la mayoría de los participantes humanos.
Estos avances se basan en años de progreso constante. Los sistemas utilizan lenguajes matemáticos formales como Lean para construir pruebas rigurosas y emplean métodos como el aprendizaje curricular, entrenándose en problemas de dificultad creciente. Este proceso permite a la IA comprender relaciones complejas entre objetos matemáticos, reconocer patrones sutiles y formular pruebas elegantes.
La lucha elemental
La misma IA que triunfa en las Olimpiadas suele fracasar en tareas aparentemente triviales. Cuando se le pide que multiplique números grandes, puede dar con seguridad una respuesta incorrecta. Su rendimiento en otras operaciones aritméticas básicas puede ser igualmente impredecible. El problema va más allá del simple cálculo. Estos sistemas suelen tener problemas con problemas de palabras que requieren el seguimiento de múltiples cantidades, la comprensión del contexto del mundo real o la aplicación secuencial de operaciones fundamentales.
Esta debilidad tiene su origen en el funcionamiento de estos modelos. Los grandes modelos lingüísticos predicen el siguiente fragmento de texto basándose en patrones de sus datos de entrenamiento. Cuando ven "2 + 2", emiten correctamente "4", no porque comprendan la suma, sino porque esta secuencia aparece de forma ubicua en su entrenamiento. Si se les presentan cálculos inusuales y poco frecuentes, su rendimiento cae en picado. Son motores de emparejamiento de patrones, que sobresalen con patrones claros y coherentes, pero que tienen dificultades cuando se les obliga a calcular algo nuevo.
La paradoja de la arquitectura
La contradicción entre el éxito de las Olimpiadas y el fracaso de la aritmética apunta a un problema arquitectónico más profundo. La IA moderna destaca en problemas que pueden resolverse mediante el reconocimiento de patrones, la deducción lógica y la exploración sistemática de espacios de soluciones. Los problemas de las Olimpiadas, aunque difíciles, a menudo poseen estructuras elegantes que la IA puede aprovechar. Los sistemas pueden explorar estrategias de prueba, verificar pasos lógicos y basarse en marcos matemáticos establecidos, operando en un mundo gobernado por símbolos, reglas y lógica.
La aritmética básica, paradójicamente, presenta un reto diferente. Exige la manipulación precisa de cantidades, no la coincidencia de patrones. Requiere una comprensión de la magnitud numérica y de las relaciones que no pueden aproximarse. Cuando un modelo de IA trata la aritmética como una tarea de modelado del lenguaje, ve los números como fichas que predecir en lugar de cantidades que calcular. Este desajuste fundamental entre los requisitos de la tarea y la arquitectura del modelo crea la diferencia de rendimiento observada.
Los datos de entrenamiento y sus limitaciones
Las capacidades de la IA dependen en gran medida de los datos de entrenamiento. Las pruebas matemáticas y los problemas avanzados suelen estar en línea en formatos bien estructurados, como artículos académicos, libros de texto y recursos educativos, que proporcionan ejemplos claros de razonamiento. En Internet abundan los debates sobre conceptos matemáticos y estrategias de resolución de problemas, lo que crea un rico corpus para el aprendizaje del pensamiento avanzado.
Las matemáticas elementales se enfrentan a un problema diferente. Aunque la aritmética básica es habitual en Internet, rara vez va acompañada de explicaciones detalladas del proceso subyacente. Los cálculos sencillos se enuncian como hechos, no se explican como procedimientos. Los datos de entrenamiento contienen los resultados de los cálculos, pero no el razonamiento paso a paso, lo que crea una laguna de comprensión que se manifiesta en un rendimiento deficiente en tareas fundamentales.
Implicaciones para el desarrollo de la IA
Esta inteligencia irregular tiene implicaciones cruciales para el diseño y el despliegue de la IA. El éxito en tareas complejas no garantiza la competencia en otras más sencillas. Una IA que demuestre teoremas puede fracasar a la hora de cuadrar una chequera; un sistema que escriba código puede tener problemas con el cálculo básico. Esta realidad exige una evaluación cuidadosa de las capacidades y limitaciones de las aplicaciones en el mundo real.
El fenómeno también subraya el valor de los enfoques híbridos. En lugar de esperar que un único modelo se encargue de todo, es posible que necesitemos sistemas especializados para distintas tareas. Combinar la computación simbólica para la aritmética con modelos lingüísticos para el razonamiento podría aportar soluciones más fiables. El futuro puede estar en orquestar múltiples sistemas especializados en lugar de perseguir una inteligencia única y monolítica.
El camino a seguir
Reconocer la inteligencia irregular aclara el camino hacia una IA más capaz. Los investigadores están desarrollando formas de integrar herramientas computacionales en los modelos lingüísticos, lo que les permite descargar la aritmética en calculadoras específicas. Las nuevas estrategias de entrenamiento enseñan a los modelos cuándo utilizar herramientas externas en lugar de interiorizar cada habilidad. Esto refleja la inteligencia humana, en la que utilizamos herramientas para el cálculo y concentramos nuestra energía mental en el razonamiento de alto nivel.
En última instancia, la paradoja de la inteligencia irregular enseña humildad. Estos sistemas no son ni universalmente superiores ni uniformemente limitados. Poseen un complejo tapiz de puntos fuertes y débiles que debemos comprender para utilizarlos y mejorarlos con eficacia. El progreso requiere no sólo ampliar las capacidades de la IA, sino también abordar sus lagunas fundamentales. Las máquinas que demuestran teoremas pero fallan en las sumas básicas nos recuerdan que la inteligencia -artificial o humana- sigue siendo un fenómeno polifacético que desafía una definición sencilla.
Lo esencial
La capacidad de la IA para resolver problemas de olimpiadas, pero no matemáticas sencillas, demuestra que la inteligencia se desarrolla de forma desigual. Un sistema puede ser brillante en un área y sorprendentemente débil en otra. Comprender este perfil irregular es esencial para diseñar y aplicar la IA de forma responsable. En lugar de un único modelo para todas las tareas, la solución puede pasar por combinar distintos enfoques que aprovechen los puntos fuertes de cada sistema. El progreso en el mundo real vendrá de construir una IA que funcione de forma fiable en la práctica, no de dar por sentado que destacará en todo.
Artículo relacionado
La primera serie de AIGC de Yaoke Media, «El misterio del bronce en Qinling», se estrena hoy con protagonistas creados por IA
Hoy se estrena oficialmente la miniserie de misterio y fantasía con IA generativa (AIGC) de Yaoke Media, «La historia secreta del bronce de Qinling». Protagonizada por los dos primeros actores de IA c
Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI
El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Recomendaciones de temas especiales relacionados
comentario (2)
0/500
看到AI在奧數奪金卻卡在小學數學,真是有趣的反差!這是不是說明AI擅長複雜模式卻容易在基礎邏輯上翻車?讓人想起有些天才不也會忘記帶鑰匙嗎?😂 不過這也提醒我們,AI的「思考」方式可能和人類完全不同,未來教育是不是得調整方向了?
Interessant, dass KI bei Olympiaden glänzt, aber bei Schulmathe Probleme hat. Vielleicht liegt's daran, dass sie Muster in komplexen Aufgaben erkennt, aber das grundlegende Verständnis fehlt? 🤔 Erinnert mich an einen klugen Schüler, der komplizierte Formeln löst, aber beim Einkaufen nicht richtig rechnen kann. Die Prioritäten in der KI-Entwicklung sind manchmal echt kurios.

El año 2025 marcó un hito notable cuando los sistemas Google DeepMind y OpenAI obtuvieron medallas de oro en la Olimpiada Internacional de Matemáticas. Estos modelos de IA resolvieron problemas que normalmente solo resuelven algunos de los jóvenes matemáticos más brillantes del mundo. Sin embargo, estos mismos sistemas tropiezan a menudo con problemas aritméticos básicos que cualquier estudiante de secundaria podría resolver. Esta sorprendente paradoja revela algo fundamental sobre la IA contemporánea: estamos asistiendo a la aparición de una inteligencia irregular, en la que las máquinas muestran una capacidad sobrehumana en dominios específicos mientras fracasan en tareas que consideramos elementales.
El triunfo de la Olimpiada
La Olimpiada Matemática Internacional representa la cumbre de la competición matemática preuniversitaria. Cada año, los mejores estudiantes se enfrentan a seis problemas que requieren un profundo conocimiento, creatividad y técnicas de demostración avanzadas. En 2025, las IA de Google DeepMind y OpenAI obtuvieron 35 de 42 puntos, lo que les valió la medalla de oro. AlphaGeometry 2 de DeepMind resolvió un complejo problema de geometría en solo 19 segundos, mientras que AlphaProof abordó problemas de teoría numérica y álgebra que dejaron perplejos a la mayoría de los participantes humanos.
Estos avances se basan en años de progreso constante. Los sistemas utilizan lenguajes matemáticos formales como Lean para construir pruebas rigurosas y emplean métodos como el aprendizaje curricular, entrenándose en problemas de dificultad creciente. Este proceso permite a la IA comprender relaciones complejas entre objetos matemáticos, reconocer patrones sutiles y formular pruebas elegantes.
La lucha elemental
La misma IA que triunfa en las Olimpiadas suele fracasar en tareas aparentemente triviales. Cuando se le pide que multiplique números grandes, puede dar con seguridad una respuesta incorrecta. Su rendimiento en otras operaciones aritméticas básicas puede ser igualmente impredecible. El problema va más allá del simple cálculo. Estos sistemas suelen tener problemas con problemas de palabras que requieren el seguimiento de múltiples cantidades, la comprensión del contexto del mundo real o la aplicación secuencial de operaciones fundamentales.
Esta debilidad tiene su origen en el funcionamiento de estos modelos. Los grandes modelos lingüísticos predicen el siguiente fragmento de texto basándose en patrones de sus datos de entrenamiento. Cuando ven "2 + 2", emiten correctamente "4", no porque comprendan la suma, sino porque esta secuencia aparece de forma ubicua en su entrenamiento. Si se les presentan cálculos inusuales y poco frecuentes, su rendimiento cae en picado. Son motores de emparejamiento de patrones, que sobresalen con patrones claros y coherentes, pero que tienen dificultades cuando se les obliga a calcular algo nuevo.
La paradoja de la arquitectura
La contradicción entre el éxito de las Olimpiadas y el fracaso de la aritmética apunta a un problema arquitectónico más profundo. La IA moderna destaca en problemas que pueden resolverse mediante el reconocimiento de patrones, la deducción lógica y la exploración sistemática de espacios de soluciones. Los problemas de las Olimpiadas, aunque difíciles, a menudo poseen estructuras elegantes que la IA puede aprovechar. Los sistemas pueden explorar estrategias de prueba, verificar pasos lógicos y basarse en marcos matemáticos establecidos, operando en un mundo gobernado por símbolos, reglas y lógica.
La aritmética básica, paradójicamente, presenta un reto diferente. Exige la manipulación precisa de cantidades, no la coincidencia de patrones. Requiere una comprensión de la magnitud numérica y de las relaciones que no pueden aproximarse. Cuando un modelo de IA trata la aritmética como una tarea de modelado del lenguaje, ve los números como fichas que predecir en lugar de cantidades que calcular. Este desajuste fundamental entre los requisitos de la tarea y la arquitectura del modelo crea la diferencia de rendimiento observada.
Los datos de entrenamiento y sus limitaciones
Las capacidades de la IA dependen en gran medida de los datos de entrenamiento. Las pruebas matemáticas y los problemas avanzados suelen estar en línea en formatos bien estructurados, como artículos académicos, libros de texto y recursos educativos, que proporcionan ejemplos claros de razonamiento. En Internet abundan los debates sobre conceptos matemáticos y estrategias de resolución de problemas, lo que crea un rico corpus para el aprendizaje del pensamiento avanzado.
Las matemáticas elementales se enfrentan a un problema diferente. Aunque la aritmética básica es habitual en Internet, rara vez va acompañada de explicaciones detalladas del proceso subyacente. Los cálculos sencillos se enuncian como hechos, no se explican como procedimientos. Los datos de entrenamiento contienen los resultados de los cálculos, pero no el razonamiento paso a paso, lo que crea una laguna de comprensión que se manifiesta en un rendimiento deficiente en tareas fundamentales.
Implicaciones para el desarrollo de la IA
Esta inteligencia irregular tiene implicaciones cruciales para el diseño y el despliegue de la IA. El éxito en tareas complejas no garantiza la competencia en otras más sencillas. Una IA que demuestre teoremas puede fracasar a la hora de cuadrar una chequera; un sistema que escriba código puede tener problemas con el cálculo básico. Esta realidad exige una evaluación cuidadosa de las capacidades y limitaciones de las aplicaciones en el mundo real.
El fenómeno también subraya el valor de los enfoques híbridos. En lugar de esperar que un único modelo se encargue de todo, es posible que necesitemos sistemas especializados para distintas tareas. Combinar la computación simbólica para la aritmética con modelos lingüísticos para el razonamiento podría aportar soluciones más fiables. El futuro puede estar en orquestar múltiples sistemas especializados en lugar de perseguir una inteligencia única y monolítica.
El camino a seguir
Reconocer la inteligencia irregular aclara el camino hacia una IA más capaz. Los investigadores están desarrollando formas de integrar herramientas computacionales en los modelos lingüísticos, lo que les permite descargar la aritmética en calculadoras específicas. Las nuevas estrategias de entrenamiento enseñan a los modelos cuándo utilizar herramientas externas en lugar de interiorizar cada habilidad. Esto refleja la inteligencia humana, en la que utilizamos herramientas para el cálculo y concentramos nuestra energía mental en el razonamiento de alto nivel.
En última instancia, la paradoja de la inteligencia irregular enseña humildad. Estos sistemas no son ni universalmente superiores ni uniformemente limitados. Poseen un complejo tapiz de puntos fuertes y débiles que debemos comprender para utilizarlos y mejorarlos con eficacia. El progreso requiere no sólo ampliar las capacidades de la IA, sino también abordar sus lagunas fundamentales. Las máquinas que demuestran teoremas pero fallan en las sumas básicas nos recuerdan que la inteligencia -artificial o humana- sigue siendo un fenómeno polifacético que desafía una definición sencilla.
Lo esencial
La capacidad de la IA para resolver problemas de olimpiadas, pero no matemáticas sencillas, demuestra que la inteligencia se desarrolla de forma desigual. Un sistema puede ser brillante en un área y sorprendentemente débil en otra. Comprender este perfil irregular es esencial para diseñar y aplicar la IA de forma responsable. En lugar de un único modelo para todas las tareas, la solución puede pasar por combinar distintos enfoques que aprovechen los puntos fuertes de cada sistema. El progreso en el mundo real vendrá de construir una IA que funcione de forma fiable en la práctica, no de dar por sentado que destacará en todo.
La primera serie de AIGC de Yaoke Media, «El misterio del bronce en Qinling», se estrena hoy con protagonistas creados por IA
Hoy se estrena oficialmente la miniserie de misterio y fantasía con IA generativa (AIGC) de Yaoke Media, «La historia secreta del bronce de Qinling». Protagonizada por los dos primeros actores de IA c
Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI
El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
看到AI在奧數奪金卻卡在小學數學,真是有趣的反差!這是不是說明AI擅長複雜模式卻容易在基礎邏輯上翻車?讓人想起有些天才不也會忘記帶鑰匙嗎?😂 不過這也提醒我們,AI的「思考」方式可能和人類完全不同,未來教育是不是得調整方向了?
Interessant, dass KI bei Olympiaden glänzt, aber bei Schulmathe Probleme hat. Vielleicht liegt's daran, dass sie Muster in komplexen Aufgaben erkennt, aber das grundlegende Verständnis fehlt? 🤔 Erinnert mich an einen klugen Schüler, der komplizierte Formeln löst, aber beim Einkaufen nicht richtig rechnen kann. Die Prioritäten in der KI-Entwicklung sind manchmal echt kurios.











