ИИ DeepMind превосходит золотые призеры IMO
Последний ИИ Google DeepMind, AlphaGeometry2, превзошел среднего золотого медалиста, решая геометрические задачи на Международной математической олимпиаде (IMO). Эта улучшенная версия AlphaGeometry, представленная в январе, решила 84% геометрических задач из IMO за последние 25 лет.
Почему DeepMind сосредоточился на школьном математическом конкурсе? Они считают, что решение сложных задач евклидовой геометрии может стать шагом к созданию более продвинутого ИИ. Это требует логического мышления и умения выбирать пути решения, что важно для будущих универсальных ИИ-систем.
Этим летом DeepMind представил систему, объединяющую AlphaGeometry2 с AlphaProof, другой моделью ИИ для формального математического мышления. Вместе они решили четыре из шести задач IMO 2024. Этот подход может быть применен к другим областям математики и науки, например, к сложным инженерным расчетам.
AlphaGeometry2 работает на основе языковой модели из семейства Gemini от Google и "символического движка". Модель Gemini помогает движку, применяющему математические правила, создавать доказательства для геометрических теорем.

Типичная диаграмма геометрической задачи на экзамене IMO. Источник: Google (открывается в новом окне) В IMO геометрические задачи часто требуют добавления "конструкций", таких как точки, линии или окружности, к диаграммам. Модель Gemini в AlphaGeometry2 предсказывает полезные конструкции, помогая символическому движку делать выводы.
Как это работает: модель Gemini предлагает шаги и конструкции на формальном математическом языке, а движок проверяет их логическую согласованность. AlphaGeometry2 использует алгоритм поиска для одновременного исследования нескольких путей решения и сохраняет полезные находки в общей базе знаний.
Задача считается "решенной", когда AlphaGeometry2 комбинирует предложения модели Gemini с известными принципами символического движка для создания полного доказательства.
Из-за нехватки подходящих данных для обучения геометрии DeepMind создал синтетические данные, сгенерировав более 300 миллионов теорем и доказательств различной сложности для тренировки языковой модели AlphaGeometry2.
Команда DeepMind протестировала AlphaGeometry2 на 45 геометрических задачах из IMO 2000–2024 годов, расширив их до 50. AlphaGeometry2 решил 42, превзойдя средний результат золотого медалиста — 40,9.
Однако у AlphaGeometry2 есть ограничения. Он затрудняется с задачами, включающими переменное количество точек, нелинейные уравнения и неравенства. Хотя это не первый ИИ, достигший уровня золотой медали в геометрии, он первый, решивший такой большой набор задач.
На более сложном наборе из 29 номинированных задач IMO, еще не использованных в соревнованиях, AlphaGeometry2 решил только 20.
Результаты исследования, вероятно, вызовут дальнейшие споры о лучшем подходе к созданию ИИ. Следует ли сосредоточиться на манипуляции символами, где ИИ использует правила для работы с символами, представляющими знания, или на нейронных сетях, имитирующих структуру человеческого мозга и обучающихся на данных?
AlphaGeometry2 использует гибридный подход, комбинируя архитектуру нейронной сети модели Gemini с символическим движком, основанным на правилах.
Сторонники нейронных сетей утверждают, что интеллектуальное поведение может возникать из огромных объемов данных и вычислительных мощностей. Напротив, сторонники символического ИИ считают, что он лучше подходит для кодирования знаний, рассуждений в сложных сценариях и объяснения решений.
Винс Конitzer, профессор компьютерных наук Университета Карнеги-Меллон, специализирующийся на ИИ, отметил контраст между впечатляющим прогрессом в тестах, таких как IMO, и продолжающимися трудностями языковых моделей с простыми задачами здравого смысла. Он подчеркнул необходимость лучшего понимания этих систем и связанных с ними рисков.
AlphaGeometry2 показывает, что сочетание манипуляции символами и нейронных сетей может быть перспективным путем к созданию универсального ИИ. Интересно, что команда DeepMind обнаружила, что языковая модель AlphaGeometry2 может генерировать частичные решения задач без помощи символического движка, намекая на потенциал языковых моделей стать самодостаточными в будущем.
Однако команда отметила, что, пока скорость языковых моделей не улучшится и проблема галлюцинаций не будет решена, инструменты, такие как символические движки, останутся необходимыми для математических приложений.
Связанная статья
Google подписывается на Кодекс практики ЕС по ИИ на фоне отраслевых дискуссий
Google обязалась принять добровольный Кодекс практики ЕС по ИИ, рамки, разработанные для помощи разработчикам ИИ в соответствии с Законом ЕС об ИИ путем внедрения соответствующих процессов и систем.В
Google представляет готовые к использованию модели ИИ Gemini 2.5 для конкуренции с OpenAI на корпоративном рынке
Google в понедельник усилила свою стратегию в области ИИ, запустив продвинутые модели Gemini 2.5 для корпоративного использования и представив экономичный вариант для конкуренции по цене и производите
Meta Усиливает Безопасность ИИ с Помощью Продвинутых Инструментов Llama
Meta выпустила новые инструменты безопасности Llama для укрепления разработки ИИ и защиты от новых угроз.Эти усовершенствованные инструменты безопасности модели ИИ Llama сочетаются с новыми ресурсами
Комментарии (27)
AlbertSmith
10 августа 2025 г., 0:00:59 GMT+03:00
Wow, AlphaGeometry2 is killing it at IMO geometry problems! Beating gold medalists is wild—makes me wonder if AI will soon design math contests instead of just solving them. 😮
0
JackCarter
28 июля 2025 г., 5:13:31 GMT+03:00
This AI beating IMO champs is wild! 🤯 Makes me wonder if it could tutor me in math or just take over the world one proof at a time.
0
LarryMartin
20 апреля 2025 г., 12:52:37 GMT+03:00
AlphaGeometry2는 정말 놀랍네요! IMO 기하 문제를 금메달리스트보다 더 잘 풀어요. 하지만 저는 수학 천재가 아니라서 마술 쇼를 보는 기분이에요. 좀 더 이해할 수 있으면 좋겠어요! 🤯
0
JerryGonzález
17 апреля 2025 г., 2:58:03 GMT+03:00
DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて信じられない!まるでAIが人間より賢いSF映画を見ているよう。でも本当に、私の宿題を手伝ってくれるのかな?😂
0
RaymondBaker
16 апреля 2025 г., 14:21:57 GMT+03:00
AlphaGeometry2 is mind-blowing! It's solving IMO geometry problems better than gold medalists. But I'm no math whiz, so it's more like watching a magic show for me. Wish I could understand it better! 🤯
0
JonathanAllen
16 апреля 2025 г., 11:15:26 GMT+03:00
AlphaGeometry2 é impressionante! Resolve problemas de geometria do IMO melhor que medalhistas de ouro. Mas eu não sou um gênio em matemática, então pra mim é como assistir a um show de mágica. Queria entender melhor! 🤯
0
Последний ИИ Google DeepMind, AlphaGeometry2, превзошел среднего золотого медалиста, решая геометрические задачи на Международной математической олимпиаде (IMO). Эта улучшенная версия AlphaGeometry, представленная в январе, решила 84% геометрических задач из IMO за последние 25 лет.
Почему DeepMind сосредоточился на школьном математическом конкурсе? Они считают, что решение сложных задач евклидовой геометрии может стать шагом к созданию более продвинутого ИИ. Это требует логического мышления и умения выбирать пути решения, что важно для будущих универсальных ИИ-систем.
Этим летом DeepMind представил систему, объединяющую AlphaGeometry2 с AlphaProof, другой моделью ИИ для формального математического мышления. Вместе они решили четыре из шести задач IMO 2024. Этот подход может быть применен к другим областям математики и науки, например, к сложным инженерным расчетам.
AlphaGeometry2 работает на основе языковой модели из семейства Gemini от Google и "символического движка". Модель Gemini помогает движку, применяющему математические правила, создавать доказательства для геометрических теорем.
В IMO геометрические задачи часто требуют добавления "конструкций", таких как точки, линии или окружности, к диаграммам. Модель Gemini в AlphaGeometry2 предсказывает полезные конструкции, помогая символическому движку делать выводы.
Как это работает: модель Gemini предлагает шаги и конструкции на формальном математическом языке, а движок проверяет их логическую согласованность. AlphaGeometry2 использует алгоритм поиска для одновременного исследования нескольких путей решения и сохраняет полезные находки в общей базе знаний.
Задача считается "решенной", когда AlphaGeometry2 комбинирует предложения модели Gemini с известными принципами символического движка для создания полного доказательства.
Из-за нехватки подходящих данных для обучения геометрии DeepMind создал синтетические данные, сгенерировав более 300 миллионов теорем и доказательств различной сложности для тренировки языковой модели AlphaGeometry2.
Команда DeepMind протестировала AlphaGeometry2 на 45 геометрических задачах из IMO 2000–2024 годов, расширив их до 50. AlphaGeometry2 решил 42, превзойдя средний результат золотого медалиста — 40,9.
Однако у AlphaGeometry2 есть ограничения. Он затрудняется с задачами, включающими переменное количество точек, нелинейные уравнения и неравенства. Хотя это не первый ИИ, достигший уровня золотой медали в геометрии, он первый, решивший такой большой набор задач.
На более сложном наборе из 29 номинированных задач IMO, еще не использованных в соревнованиях, AlphaGeometry2 решил только 20.
Результаты исследования, вероятно, вызовут дальнейшие споры о лучшем подходе к созданию ИИ. Следует ли сосредоточиться на манипуляции символами, где ИИ использует правила для работы с символами, представляющими знания, или на нейронных сетях, имитирующих структуру человеческого мозга и обучающихся на данных?
AlphaGeometry2 использует гибридный подход, комбинируя архитектуру нейронной сети модели Gemini с символическим движком, основанным на правилах.
Сторонники нейронных сетей утверждают, что интеллектуальное поведение может возникать из огромных объемов данных и вычислительных мощностей. Напротив, сторонники символического ИИ считают, что он лучше подходит для кодирования знаний, рассуждений в сложных сценариях и объяснения решений.
Винс Конitzer, профессор компьютерных наук Университета Карнеги-Меллон, специализирующийся на ИИ, отметил контраст между впечатляющим прогрессом в тестах, таких как IMO, и продолжающимися трудностями языковых моделей с простыми задачами здравого смысла. Он подчеркнул необходимость лучшего понимания этих систем и связанных с ними рисков.
AlphaGeometry2 показывает, что сочетание манипуляции символами и нейронных сетей может быть перспективным путем к созданию универсального ИИ. Интересно, что команда DeepMind обнаружила, что языковая модель AlphaGeometry2 может генерировать частичные решения задач без помощи символического движка, намекая на потенциал языковых моделей стать самодостаточными в будущем.
Однако команда отметила, что, пока скорость языковых моделей не улучшится и проблема галлюцинаций не будет решена, инструменты, такие как символические движки, останутся необходимыми для математических приложений.



Wow, AlphaGeometry2 is killing it at IMO geometry problems! Beating gold medalists is wild—makes me wonder if AI will soon design math contests instead of just solving them. 😮




This AI beating IMO champs is wild! 🤯 Makes me wonder if it could tutor me in math or just take over the world one proof at a time.




AlphaGeometry2는 정말 놀랍네요! IMO 기하 문제를 금메달리스트보다 더 잘 풀어요. 하지만 저는 수학 천재가 아니라서 마술 쇼를 보는 기분이에요. 좀 더 이해할 수 있으면 좋겠어요! 🤯




DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて信じられない!まるでAIが人間より賢いSF映画を見ているよう。でも本当に、私の宿題を手伝ってくれるのかな?😂




AlphaGeometry2 is mind-blowing! It's solving IMO geometry problems better than gold medalists. But I'm no math whiz, so it's more like watching a magic show for me. Wish I could understand it better! 🤯




AlphaGeometry2 é impressionante! Resolve problemas de geometria do IMO melhor que medalhistas de ouro. Mas eu não sou um gênio em matemática, então pra mim é como assistir a um show de mágica. Queria entender melhor! 🤯












