ИИ DeepMind превосходит золотые призеры IMO

Дом

Новости

10 апреля 2025 г.

RoyTaylor

154

# ai # Google # Math

Последний ИИ Google DeepMind, AlphaGeometry2, превзошел среднего золотого медалиста, решая геометрические задачи на Международной математической олимпиаде (IMO). Эта улучшенная версия AlphaGeometry, представленная в январе, решила 84% геометрических задач из IMO за последние 25 лет.

Почему DeepMind сосредоточился на школьном математическом конкурсе? Они считают, что решение сложных задач евклидовой геометрии может стать шагом к созданию более продвинутого ИИ. Это требует логического мышления и умения выбирать пути решения, что важно для будущих универсальных ИИ-систем.

Этим летом DeepMind представил систему, объединяющую AlphaGeometry2 с AlphaProof, другой моделью ИИ для формального математического мышления. Вместе они решили четыре из шести задач IMO 2024. Этот подход может быть применен к другим областям математики и науки, например, к сложным инженерным расчетам.

AlphaGeometry2 работает на основе языковой модели из семейства Gemini от Google и "символического движка". Модель Gemini помогает движку, применяющему математические правила, создавать доказательства для геометрических теорем.

Типичная геометрическая диаграмма на IMO.

Типичная диаграмма геометрической задачи на экзамене IMO. Источник: Google (открывается в новом окне)

В IMO геометрические задачи часто требуют добавления "конструкций", таких как точки, линии или окружности, к диаграммам. Модель Gemini в AlphaGeometry2 предсказывает полезные конструкции, помогая символическому движку делать выводы.

Как это работает: модель Gemini предлагает шаги и конструкции на формальном математическом языке, а движок проверяет их логическую согласованность. AlphaGeometry2 использует алгоритм поиска для одновременного исследования нескольких путей решения и сохраняет полезные находки в общей базе знаний.

Задача считается "решенной", когда AlphaGeometry2 комбинирует предложения модели Gemini с известными принципами символического движка для создания полного доказательства.

Из-за нехватки подходящих данных для обучения геометрии DeepMind создал синтетические данные, сгенерировав более 300 миллионов теорем и доказательств различной сложности для тренировки языковой модели AlphaGeometry2.

Команда DeepMind протестировала AlphaGeometry2 на 45 геометрических задачах из IMO 2000–2024 годов, расширив их до 50. AlphaGeometry2 решил 42, превзойдя средний результат золотого медалиста — 40,9.

Однако у AlphaGeometry2 есть ограничения. Он затрудняется с задачами, включающими переменное количество точек, нелинейные уравнения и неравенства. Хотя это не первый ИИ, достигший уровня золотой медали в геометрии, он первый, решивший такой большой набор задач.

На более сложном наборе из 29 номинированных задач IMO, еще не использованных в соревнованиях, AlphaGeometry2 решил только 20.

Результаты исследования, вероятно, вызовут дальнейшие споры о лучшем подходе к созданию ИИ. Следует ли сосредоточиться на манипуляции символами, где ИИ использует правила для работы с символами, представляющими знания, или на нейронных сетях, имитирующих структуру человеческого мозга и обучающихся на данных?

AlphaGeometry2 использует гибридный подход, комбинируя архитектуру нейронной сети модели Gemini с символическим движком, основанным на правилах.

Сторонники нейронных сетей утверждают, что интеллектуальное поведение может возникать из огромных объемов данных и вычислительных мощностей. Напротив, сторонники символического ИИ считают, что он лучше подходит для кодирования знаний, рассуждений в сложных сценариях и объяснения решений.

Винс Конitzer, профессор компьютерных наук Университета Карнеги-Меллон, специализирующийся на ИИ, отметил контраст между впечатляющим прогрессом в тестах, таких как IMO, и продолжающимися трудностями языковых моделей с простыми задачами здравого смысла. Он подчеркнул необходимость лучшего понимания этих систем и связанных с ними рисков.

AlphaGeometry2 показывает, что сочетание манипуляции символами и нейронных сетей может быть перспективным путем к созданию универсального ИИ. Интересно, что команда DeepMind обнаружила, что языковая модель AlphaGeometry2 может генерировать частичные решения задач без помощи символического движка, намекая на потенциал языковых моделей стать самодостаточными в будущем.

Однако команда отметила, что, пока скорость языковых моделей не улучшится и проблема галлюцинаций не будет решена, инструменты, такие как символические движки, останутся необходимыми для математических приложений.

Связанная статья

Midjourney представляет передовой видеогенератор с искусственным интеллектом для креативного контента Прорыв Midjourney в создании видео с помощью искусственного интеллектаКомпания Midjourney представила свой первый инструмент для создания видео на основе искусственного интеллекта, что знаменует собой

Google пресекает утечки о Pixel 10, официально раскрывая смартфон раньше времени Google дразнит поклонников ранним взглядом на предстоящую линейку смартфонов Pixel 10, демонстрируя официальный дизайн всего за несколько недель до запланированного на 20 августа мероприятия по запуск

Приложение Gemini от Google добавляет видео с искусственным интеллектом в реальном времени, Deep Research и новые функции (120 знаков) На конференции для разработчиков I/O 2025 компания Google представила значительные усовершенствования ИИ Gemini, расширив мультимодальные возможности, представив модели ИИ нового поколения и укрепив и

Комментарии (31)

0/200

Представлять на рассмотрение

KevinBrown

3 сентября 2025 г., 15:30:33 GMT+03:00

Impressionnant mais un peu flippant... Si une IA peut battre des médaillés d'or aux Olympiades, qu'est-ce qui nous reste comme domaines où les humains sont encore les meilleurs ? 😅 J'espère qu'on va pas tous devenir obsolètes !

GregoryWalker

20 августа 2025 г., 20:01:20 GMT+03:00

This AI beating IMO champs is wild! 🧠 Geometry’s tough, but AlphaGeometry2’s out here crushing it. Makes me wonder if it’ll start tutoring kids soon! 😄

AnthonyMoore

19 августа 2025 г., 22:01:23 GMT+03:00

Incroyable, AlphaGeometry2 dépasse les médaillés d'or de l'IMO en géométrie ! 😲 Ça montre à quel point l'IA avance vite, mais je me demande si elle pourrait un jour résoudre des problèmes plus... humains, comme gérer mes impôts !

GaryThomas

14 августа 2025 г., 4:00:59 GMT+03:00

This AI beating IMO gold medalists is wild! 🤯 Geometry’s tough, but AlphaGeometry2’s out here making it look easy. Wonder how far it’ll go in other math fields?

AlbertSmith

10 августа 2025 г., 0:00:59 GMT+03:00

Wow, AlphaGeometry2 is killing it at IMO geometry problems! Beating gold medalists is wild—makes me wonder if AI will soon design math contests instead of just solving them. 😮

JackCarter

28 июля 2025 г., 5:13:31 GMT+03:00

This AI beating IMO champs is wild! 🤯 Makes me wonder if it could tutor me in math or just take over the world one proof at a time.

Лучшие новости

Gemini 2.5 Pro в настоящее время неограничен и дешевле, чем Claude, GPT-4O Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами Озвучка с помощью ИИ: Ультимативное руководство по созданию реалистичных голосов ИИ ИИ Cambium превращает отходы в пиломатериалы OpenAI улучшает AI Voice Assistant для лучших чатов Как гарантировать, что ваши данные заслуживают доверия для интеграции искусственного интеллекта NoteBooklm расширяется во всем мире, добавляет слайды и расширенную проверку фактов Настройки для дата -центров США могут разблокировать 76 ГВт новой мощности. Google использует ИИ для приостановки более 39 миллионов счетов объявлений о подозрении на мошенничество Клонирование голоса с ИИ: Полное руководство по освоению конверсии голоса

Более

Показан