вариант
Дом
Новости
ИИ DeepMind превосходит золотые призеры IMO

ИИ DeepMind превосходит золотые призеры IMO

10 апреля 2025 г.
60

Последний AI Google DeepMind, Alphageometry2, сделал волны, опередив средний золотой призер в решении задач геометрии на Международной математической олимпиаде (IMO). Эта передовая версия ранее выпущенной альфагеометрии, представленная только в январе прошлого года, по сообщениям, решила 84% проблем с геометрией за последние 25 лет соревнований IMO.

Вы можете задаться вопросом, почему DeepMind сосредоточен на конкурсе по математике в старшей школе. Что ж, они считают, что взломать эти сложные проблемы евклидовой геометрии может стать ступенькой для разработки более продвинутого ИИ. Решение этих проблем требует как логических рассуждений, так и способности перемещаться по различным путям решения, навыки, которые могут иметь решающее значение для будущих систем ИИ в общем назначении.

Этим летом DeepMind продемонстрировала систему, которая объединила Alphageometry2 с Alphaproof, еще одной моделью искусственного интеллекта, предназначенной для формальной математической рассуждения. Вместе они решили четыре из шести проблем с IMO 2024 года. Этот подход может потенциально распространяться за пределы геометрии до других областей математики и науки, таких как сложные инженерные расчеты.

AlphageOmetry2 оснащен несколькими ключевыми компонентами, включая языковую модель из семейства Gemini от Google и «символический двигатель». Модель Близнецов помогает символическому двигателю, который применяет математические правила для поиска решений, при создании возможных доказательств теорем о геометрии.

Типичная геометрическая диаграмма в IMO.

Типичная диаграмма проблем с геометрией в экзамене IMO.Image Кредиты: Google (открывается в новом окне)

В IMO проблемы с геометрией часто требуют добавления «конструкций», таких как точки, линии или круги к диаграммам перед их решением. Модель Близнецов Alphageometry2 предсказывает, какие конструкции могут быть полезны, направляя символический двигатель для вычета.

Вот как это работает: модель Близнецов предлагает шаги и конструкции на формальном математическом языке, который затем двигатель проверяет на логическую последовательность. Alphageometry2 использует алгоритм поиска для одновременного изучения нескольких путей решения и сохраняет потенциально полезные результаты в общей базе знаний.

Проблема считается «решением», когда Alphageometry2 объединяет предложения модели Близнецов с известными принципами символического двигателя для формирования полного доказательства.

Из -за нехватки данных об использовании обучения для использования геометрии DeepMind создал синтетические данные для обучения языковой модели альфаггеометрии2, генерируя более 300 миллионов теорем и доказательств различной сложности.

Команда DeepMind проверила Alphageometry2 на 45 задачах геометрии от соревнований IMO, охватывающих с 2000 до 2024 года, которые они расширили до 50 проблем. AlphageOmetry2 решил 42 из них, превосходя средний балл золотого медалиста 40,9.

Однако Alphageometry2 имеет свои ограничения. Он борется с проблемами, включающими переменное количество точек, нелинейных уравнений и неравенства. Хотя это не первый искусственный интеллект, достигший производительности на уровне золота в геометрии, это первое, что делает это с таким большим набором проблем.

Столкнувшись с более жестким набором из 29 проблем с ИМО, которые еще не появились на соревнованиях, Alphageyometry2 может решить только 20.

Результаты исследования, вероятно, вызовут дальнейшие споры о лучшем подходе к созданию систем ИИ. Должны ли мы сосредоточиться на манипуляциях с символом, где ИИ использует правила для манипулирования символами, представляющими знания, или на нейронных сетях, которые имитируют структуру человеческого мозга и учатся из данных?

Alphageometry2 использует гибридный подход, объединяя архитектуру нейронной сети модели Близнецов с символическим двигателем, основанным на правилах.

Сторонники нейронных сетей утверждают, что интеллектуальное поведение может возникнуть из огромных объемов данных и вычислительной мощности. Напротив, сторонники символического ИИ считают, что это лучше подходит для кодирования знаний, рассуждения с помощью сложных сценариев и объяснения решений.

Винс Кониццер, профессор компьютерных наук Университета Карнеги -Меллона, специализирующийся на ИИ, прокомментировал контраст между впечатляющим прогрессом на контрольных показателях, таких как IMO, и продолжающейся борьбой с языковыми моделями с простыми проблемами здравого смысла. Он подчеркнул необходимость лучше понять эти системы и риски, которые они представляют.

Alphageometry2 предполагает, что сочетание символов манипуляции и нейронных сетей может быть многообещающим направлением вперед в поисках обобщаемого ИИ. Интересно, что команда DeepMind обнаружила, что языковая модель Alphageometry2 может генерировать частичные решения проблем без помощи символического двигателя, намекая на потенциал для языковых моделей стать самодостаточными в будущем.

Тем не менее, команда отметила, что до тех пор, пока не улучшится скорость языковой модели и не будет разрешена галлюцинации, такие инструменты, как символические двигатели, останутся необходимыми для математических приложений.

Связанная статья
억만장자들이 이번 주 AI 업데이트에서 일자리 자동화에 대해 논의하다 억만장자들이 이번 주 AI 업데이트에서 일자리 자동화에 대해 논의하다 안녕하세요, TechCrunch의 AI 뉴스레터에 다시 오신 것을 환영합니다! 아직 구독하지 않으셨다면, 매주 수요일마다 받은 편지함으로 바로 배달받을 수 있도록 여기를 클릭해 구독하세요.지난주에는 잠시 쉬었지만, 그럴만한 이유가 있었습니다—중국의 AI 회사 DeepSeek의 갑작스러운 급부상 덕분에 AI 뉴스 사이클이 뜨거웠습니다. 정신없는 시간이였지만,
NotebookLM 앱 출시: AI 기반 지식 도구 NotebookLM 앱 출시: AI 기반 지식 도구 NotebookLM 모바일 출시: 이제 Android와 iOS에서 만나는 AI 연구 보조 도구NotebookLM에 대한 여러분의 뜨거운 반응에 깊이 감사드립니다. 수백만 사용자가 복잡한 정보를 이해하는 필수 도구로 NotebookLM을 선택해주셨습니다. 하지만 가장 많이 받은 요청은 바로 "언제 모바일에서 사용할 수 있나
Imagen 4: 구글 최신 AI 이미지 생성기 Imagen 4: 구글 최신 AI 이미지 생성기 구글이 최신 이미지 생성 AI 모델 '이마젠 4(Imagen 4)'를 공개하며 전작 대비 향상된 시각적 경험을 약속했습니다. 이번 주 초 구글 I/O 2025에서 발표된 이 신형 모델은 품질과 다용도성 측면에서 큰 도약으로 평가받고 있습니다. 구글에 따르면 이마젠 4는 직물 표면, 물방울, 동물 털 같은 정교한 디테일 구
Комментарии (25)
HarryPerez
HarryPerez 12 апреля 2025 г., 0:00:00 GMT

DeepMind's AlphaGeometry2 beating IMO gold medalists is mind-blowing! It's amazing to see AI tackling such complex problems. But, does it really understand geometry, or is it just pattern matching? Either way, it's a huge step forward for AI in education!

JackSanchez
JackSanchez 12 апреля 2025 г., 0:00:00 GMT

DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて驚きです!AIがこんなに複雑な問題に取り組むのを見るのは素晴らしいです。でも、本当に幾何学を理解しているのか、それともただのパターンマッチングなのか?どちらにしても、教育におけるAIの大きな一歩ですね!

HenryJackson
HenryJackson 11 апреля 2025 г., 0:00:00 GMT

DeepMind의 AlphaGeometry2가 IMO 금메달리스트를 능가하다니 놀랍네요! AI가 이렇게 복잡한 문제를 다루는 걸 보는 건 정말 멋져요. 하지만 정말 기하학을 이해하는 건지, 아니면 단순히 패턴 매칭을 하는 건지 궁금해요. 어쨌든 교육에서의 AI 발전에 큰 걸음이에요!

HarryRoberts
HarryRoberts 11 апреля 2025 г., 0:00:00 GMT

O AlphaGeometry2 da DeepMind superar os medalhistas de ouro do IMO é impressionante! É incrível ver a IA lidando com problemas tão complexos. Mas, será que ela realmente entende geometria, ou é apenas correspondência de padrões? De qualquer forma, é um grande avanço para a IA na educação!

BillyRoberts
BillyRoberts 10 апреля 2025 г., 0:00:00 GMT

¡Que AlphaGeometry2 de DeepMind supere a los medallistas de oro del IMO es alucinante! Es increíble ver a la IA abordando problemas tan complejos. Pero, ¿realmente entiende la geometría, o solo está haciendo coincidencia de patrones? De cualquier manera, es un gran paso adelante para la IA en la educación!

AlbertHarris
AlbertHarris 14 апреля 2025 г., 0:00:00 GMT

DeepMind's AlphaGeometry2 is mind-blowing! It's solving geometry problems better than IMO gold medalists. I used it to help with my math homework and it was spot on! The only thing is, it's a bit too advanced for casual users like me. Still, it's a solid 4 out of 5. 📚

Вернуться к вершине
OR