DeepMind's AI Secures Gold at 2025 Math Olympiad
ИИ DeepMind достиг потрясающего прорыва в математическом мышлении, завоевав золотую медаль на Международной математической олимпиаде (IMO) 2025 года, всего через год после получения серебра в 2024 году. Этот прорыв подчеркивает растущую мощь ИИ в решении сложных абстрактных задач, требующих человеческой креативности. В этой статье рассматривается трансформационное путешествие DeepMind, ключевые технические достижения и более широкое влияние этого рубежа.
Почему IMO важна
С 1959 года Международная математическая олимпиада является главным мировым математическим соревнованием для школьников. Она бросает вызов участникам шестью сложными задачами по алгебре, геометрии, теории чисел и комбинаторике, требуя исключительной креативности, логики и элегантных доказательств.
Для ИИ IMO представляет собой серьезное испытание. В отличие от распознавания образов или стратегических игр, таких как Го, олимпиадная математика требует абстрактного мышления и синтеза новых идей — навыков, долгое время считавшихся уникально человеческими. Таким образом, IMO служит эталоном для прогресса ИИ в направлении человеческого интеллекта.
Серебряная медаль 2024 года
В 2024 году DeepMind представил две системы ИИ для задач IMO: AlphaProof и AlphaGeometry 2, обе использующие "нейросимволический" ИИ, сочетающий большие языковые модели (LLMs) с символической логикой.
AlphaProof использовал Lean, формальный математический язык, для доказательства утверждений. Он интегрировал Gemini, большую языковую модель DeepMind, с AlphaZero, системой обучения с подкреплением, известной по освоению настольных игр. Gemini переводил задачи в Lean, генерируя логические шаги, в то время как AlphaProof обучался на миллионах разнообразных математических задач, совершенствуя свои навыки через самообучение.
AlphaGeometry 2 преуспел в геометрии, где Gemini предсказывал вспомогательные конструкции, а символический движок обрабатывал дедукции. Этот гибридный подход позволил решать сложные геометрические задачи.
Системы решили четыре из шести задач IMO — две по алгебре, одну по теории чисел и одну по геометрии — набрав 28/42 балла, что принесло серебряную медаль. Это стало историческим достижением ИИ, хотя оно зависело от человеческих переводов и значительных вычислительных ресурсов.
Ключевые инновации для золота
Переход DeepMind к золоту в 2025 году обусловлен значительными техническими достижениями.
1. Доказательства на естественном языке
Ключевым изменением стало использование естественного языка для доказательств, что устранило необходимость в переводах экспертов на формальные языки. Усовершенствованный Gemini с функцией Deep Think обрабатывает задачи напрямую, создавая неформальные доказательства, формализуя ключевые шаги внутренне и предоставляя четкие доказательства на английском. Обучение с подкреплением на основе человеческих отзывов (RLHF) обеспечило лаконичные и логичные решения.
Gemini Deep Think выделяется увеличенным окном контекста и большим количеством вычислительных токенов, поддерживая многостраничное мышление. Он использует параллельное мышление, генерируя сотни путей решения, а супервизор ранжирует лучшие, подобно человеческому мозговому штурму.
2. Продвинутые методы обучения
Gemini Deep Think был доработан на корпусе из 100 000 решений с математических форумов, arXiv и университетских задач, с фильтрацией ошибок человеческими наставниками. Обучение с подкреплением с пошаговыми наградами за проверенные подлеммы направляло модель к лаконичным доказательствам. Обучение длилось три месяца с использованием 25 миллионов TPU-часов.
3. Мощность параллельной обработки
Параллелизация была критически важной, с одновременным исследованием нескольких ветвей мышления. Ресурсы динамически перераспределялись на перспективные пути, что особенно эффективно для комбинаторики. Этот подход, поддерживаемый кластерами TPU v5 от DeepMind, отражал человеческие стратегии, такие как тестирование неравенств перед полными доказательствами.
Триумф DeepMind на IMO 2025
Для обеспечения справедливости DeepMind заморозил веса модели за три недели до IMO, отфильтровав неопубликованные решения задач. Во время соревнования Gemini Deep Think решал шесть задач в текстовом формате без доступа к интернету, используя вычислительную мощность, эквивалентную ноутбуку. Он завершил доказательства менее чем за три часа, получив идеальные баллы по пяти задачам и итоговый результат 35/42 — что обеспечило золото. Доказательства ИИ были признаны строгими и тщательными, соответствующими человеческим стандартам.
Влияние на ИИ и математику
Успех DeepMind сигнализирует о прогрессе ИИ в направлении искусственного общего интеллекта (AGI), поскольку задачи IMO требуют развитого мышления. Для математики инструменты ИИ, такие как Gemini Deep Think, могут помочь в исследовании новых теорем, проверке гипотез и упрощении доказательств, освобождая математиков для концептуальной работы. Однако роль ИИ в образовании и соревнованиях поднимает вопросы о их будущей структуре.
Перспективы на будущее
Хотя некоторые математические вызовы остаются, быстрый прогресс DeepMind предполагает, что ИИ вскоре сможет решать крупные нерешенные задачи. Победа на IMO 2025 подчеркивает развивающиеся логические способности ИИ, вызывая дискуссии о том, будет ли он дополнять или переопределять человеческую креативность в математике.
Связанная статья
AI-управляемый Parallax Maker: Создание динамичных 2.5D анимаций
Преобразуйте статические изображения в захватывающие 2.5D анимации с помощью Parallax Maker. Этот инструмент с открытым исходным кодом позволяет художникам и разработчикам игр добавлять глубину и движ
Инструменты Trunk обеспечивают $40M для продвижения AI-управляемых строительных решений
Trunk Tools, новатор в области ИИ, трансформирующий управление и использование проектных данных строительными профессионалами, привлек $40 миллионов в раунде серии B. Раунд возглавил Insight Partners
AI-управляемая реклама недвижимости: Повышение качества лидов с Likely AI
В современном быстро меняющемся рынке недвижимости дифференциация имеет ключевое значение. Ad Creator от Likely AI трансформирует маркетинг, используя искусственный интеллект для создания высокотаргет
Комментарии (0)
ИИ DeepMind достиг потрясающего прорыва в математическом мышлении, завоевав золотую медаль на Международной математической олимпиаде (IMO) 2025 года, всего через год после получения серебра в 2024 году. Этот прорыв подчеркивает растущую мощь ИИ в решении сложных абстрактных задач, требующих человеческой креативности. В этой статье рассматривается трансформационное путешествие DeepMind, ключевые технические достижения и более широкое влияние этого рубежа.
Почему IMO важна
С 1959 года Международная математическая олимпиада является главным мировым математическим соревнованием для школьников. Она бросает вызов участникам шестью сложными задачами по алгебре, геометрии, теории чисел и комбинаторике, требуя исключительной креативности, логики и элегантных доказательств.
Для ИИ IMO представляет собой серьезное испытание. В отличие от распознавания образов или стратегических игр, таких как Го, олимпиадная математика требует абстрактного мышления и синтеза новых идей — навыков, долгое время считавшихся уникально человеческими. Таким образом, IMO служит эталоном для прогресса ИИ в направлении человеческого интеллекта.
Серебряная медаль 2024 года
В 2024 году DeepMind представил две системы ИИ для задач IMO: AlphaProof и AlphaGeometry 2, обе использующие "нейросимволический" ИИ, сочетающий большие языковые модели (LLMs) с символической логикой.
AlphaProof использовал Lean, формальный математический язык, для доказательства утверждений. Он интегрировал Gemini, большую языковую модель DeepMind, с AlphaZero, системой обучения с подкреплением, известной по освоению настольных игр. Gemini переводил задачи в Lean, генерируя логические шаги, в то время как AlphaProof обучался на миллионах разнообразных математических задач, совершенствуя свои навыки через самообучение.
AlphaGeometry 2 преуспел в геометрии, где Gemini предсказывал вспомогательные конструкции, а символический движок обрабатывал дедукции. Этот гибридный подход позволил решать сложные геометрические задачи.
Системы решили четыре из шести задач IMO — две по алгебре, одну по теории чисел и одну по геометрии — набрав 28/42 балла, что принесло серебряную медаль. Это стало историческим достижением ИИ, хотя оно зависело от человеческих переводов и значительных вычислительных ресурсов.
Ключевые инновации для золота
Переход DeepMind к золоту в 2025 году обусловлен значительными техническими достижениями.
1. Доказательства на естественном языке
Ключевым изменением стало использование естественного языка для доказательств, что устранило необходимость в переводах экспертов на формальные языки. Усовершенствованный Gemini с функцией Deep Think обрабатывает задачи напрямую, создавая неформальные доказательства, формализуя ключевые шаги внутренне и предоставляя четкие доказательства на английском. Обучение с подкреплением на основе человеческих отзывов (RLHF) обеспечило лаконичные и логичные решения.
Gemini Deep Think выделяется увеличенным окном контекста и большим количеством вычислительных токенов, поддерживая многостраничное мышление. Он использует параллельное мышление, генерируя сотни путей решения, а супервизор ранжирует лучшие, подобно человеческому мозговому штурму.
2. Продвинутые методы обучения
Gemini Deep Think был доработан на корпусе из 100 000 решений с математических форумов, arXiv и университетских задач, с фильтрацией ошибок человеческими наставниками. Обучение с подкреплением с пошаговыми наградами за проверенные подлеммы направляло модель к лаконичным доказательствам. Обучение длилось три месяца с использованием 25 миллионов TPU-часов.
3. Мощность параллельной обработки
Параллелизация была критически важной, с одновременным исследованием нескольких ветвей мышления. Ресурсы динамически перераспределялись на перспективные пути, что особенно эффективно для комбинаторики. Этот подход, поддерживаемый кластерами TPU v5 от DeepMind, отражал человеческие стратегии, такие как тестирование неравенств перед полными доказательствами.
Триумф DeepMind на IMO 2025
Для обеспечения справедливости DeepMind заморозил веса модели за три недели до IMO, отфильтровав неопубликованные решения задач. Во время соревнования Gemini Deep Think решал шесть задач в текстовом формате без доступа к интернету, используя вычислительную мощность, эквивалентную ноутбуку. Он завершил доказательства менее чем за три часа, получив идеальные баллы по пяти задачам и итоговый результат 35/42 — что обеспечило золото. Доказательства ИИ были признаны строгими и тщательными, соответствующими человеческим стандартам.
Влияние на ИИ и математику
Успех DeepMind сигнализирует о прогрессе ИИ в направлении искусственного общего интеллекта (AGI), поскольку задачи IMO требуют развитого мышления. Для математики инструменты ИИ, такие как Gemini Deep Think, могут помочь в исследовании новых теорем, проверке гипотез и упрощении доказательств, освобождая математиков для концептуальной работы. Однако роль ИИ в образовании и соревнованиях поднимает вопросы о их будущей структуре.
Перспективы на будущее
Хотя некоторые математические вызовы остаются, быстрый прогресс DeepMind предполагает, что ИИ вскоре сможет решать крупные нерешенные задачи. Победа на IMO 2025 подчеркивает развивающиеся логические способности ИИ, вызывая дискуссии о том, будет ли он дополнять или переопределять человеческую креативность в математике.












