DeepMind的AI優於IMO金牌得主
Google DeepMind的最新AI Alphageometry2通過在解決國際數學奧林匹克(IMO)上解決幾何問題方面的平均金牌獲得者,從而引起了波浪。據報導,該先前發布的字母計量法的先前版本是在去年1月推出的,該版本已解決了IMO比賽的最後25年中的84%的幾何問題。
您可能想知道為什麼DeepMind專注於高中數學比賽。好吧,他們認為破解這些具有挑戰性的歐幾里得幾何問題可能是發展更先進的AI的墊腳石。解決這些問題需要邏輯推理和瀏覽各種解決方案路徑的能力,這對於未來的通用AI系統可能至關重要。
今年夏天,DeepMind展示了一個系統,該系統將Alphageometry2與Alphaproof結合使用,這是另一種用於正式數學推理的AI模型。他們一起解決了2024年IMO的六個問題中的四個。這種方法可能會超越幾何形狀到數學和科學的其他領域,例如復雜的工程計算。
Alphageometry2由一些關鍵組件提供動力,包括Google的雙子座家族的語言模型和“象徵性引擎”。雙子座模型有助於符號引擎,該引擎應用數學規則來找到解決方案,並為幾何定理創建可行的證據。

IMO考試中的典型幾何問題圖。圖片學分:Google(在新窗口中打開)
在IMO中,幾何問題通常需要在求解之前添加“構造”,例如點,線或圓圈。 Alphageometry2的雙子座模型預測,哪些構造可能會有所幫助,從而指導符號引擎進行扣除。
它的工作方式如下:雙子座模型在形式數學語言中提出了步驟和構造,然後發動機檢查邏輯一致性。 Alphageometry2使用搜索算法同時探索多個解決方案路徑,並將潛在有用的發現存儲在共享知識庫中。
當Alphageometry2將雙子座模型的建議與符號引擎的已知原理結合起來以形成完整證明時,將考慮一個問題。
由於缺乏可用的幾何訓練數據,DeepMind創建了綜合數據來訓練Alphageometry2的語言模型,產生了超過3億個定理和變化複雜性的證據。
DeepMind團隊在IMO競爭中跨越2000年至2024年的45個幾何問題測試了Alphageometry2,並將其擴展為50個問題。 Alphageometry2解決了其中的42個,超過了40.9的平均金牌得主得分。
但是,Alphageometry2具有其局限性。它在涉及可變數量的點,非線性方程和不平等的問題上掙扎。雖然這不是第一個在幾何形狀中達到金色級別性能的AI,但它是第一個使用如此大的問題進行的AI。
面對尚未在比賽中尚未出現的29個IMO提名問題的艱難集時,Alphageometry2只能解決20。
該研究的結果可能會引發有關建立AI系統的最佳方法的進一步辯論。我們是否應該專注於符號操縱,在其中AI使用規則來操縱代表知識的符號,或者是模仿人類大腦結構並從數據中學習的神經網絡?
Alphageometry2採用了混合方法,將雙子座模型的神經網絡結構與基於規則的符號引擎相結合。
神經網絡的支持者認為,智能行為可以從大量的數據和計算能力中出現。相反,符號AI支持者認為,它更適合編碼知識,通過複雜的場景和解釋解決方案。
Carnegie Mellon大學計算機科學教授Vince Conitzer專門研究AI,他評論了IMO等基準的令人印象深刻的進展與具有簡單常識性問題的語言模型的持續鬥爭之間的對比。他強調有必要更好地了解這些系統及其構成的風險。
Alphageometry2表明,將符號操縱和神經網絡結合起來可能是尋求可推廣AI的前進方式。有趣的是,DeepMind團隊發現,如果沒有符號引擎的幫助,Alphageometry2的語言模型可以為問題提供部分解決方案,這暗示了語言模型將來變得自給自足的潛力。
但是,團隊指出,直到語言速度提高並解決了幻覺之前,符號引擎等工具對於數學應用程序至關重要。
相關文章
亿万富翁讨论在本周AI更新中自动化取代工作
大家好,欢迎回到TechCrunch的AI通讯!如果您尚未订阅,可以在这里注册,每周三直接送达您的收件箱。我们上周稍作休息,但原因充分——AI新闻周期火爆,很大程度上归功于中国AI公司DeepSeek的突然崛起。这段时间真是旋风般忙碌,但我们现在回来了,正好为您带来OpenAI的最新动态。周末,OpenAI首席执行官Sam Altman在东京停留,与SoftBank掌门人孙正义会面。SoftBan
NotebookLM应用上线:AI驱动的知识工具
NotebookLM移动端上线:您的人工智能研究助手现已登陆安卓和iOS平台 NotebookLM的受欢迎程度令我们惊叹不已——数百万用户已将其作为处理复杂信息的首选工具。但有一个问题被反复提及:"我们什么时候能在移动端使用NotebookLM?" 现在,等待结束了!🎉 NotebookLM移动应用现已登陆安卓和iOS平台,将AI辅助学习的强大功能装进您
Imagen 4:谷歌最新AI图像生成器
谷歌近日发布了最新图像生成AI模型Imagen 4,承诺为用户带来比前代Imagen 3更出色的视觉体验。这款在本周谷歌I/O 2025大会上亮相的新模型,在画质表现和风格多样性方面实现了重大突破。官方介绍称,Imagen 4能精准呈现织物纹理、水珠飞溅和动物毛发等复杂细节,同时轻松驾驭写实与抽象两种风格。其输出分辨率最高可达2K,并支持多种画幅比例,适配各
評論 (25)
0/200
HarryPerez
2025-04-12 08:00:00
DeepMind's AlphaGeometry2 beating IMO gold medalists is mind-blowing! It's amazing to see AI tackling such complex problems. But, does it really understand geometry, or is it just pattern matching? Either way, it's a huge step forward for AI in education!
0
JackSanchez
2025-04-12 08:00:00
DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて驚きです!AIがこんなに複雑な問題に取り組むのを見るのは素晴らしいです。でも、本当に幾何学を理解しているのか、それともただのパターンマッチングなのか?どちらにしても、教育におけるAIの大きな一歩ですね!
0
HenryJackson
2025-04-11 08:00:00
DeepMind의 AlphaGeometry2가 IMO 금메달리스트를 능가하다니 놀랍네요! AI가 이렇게 복잡한 문제를 다루는 걸 보는 건 정말 멋져요. 하지만 정말 기하학을 이해하는 건지, 아니면 단순히 패턴 매칭을 하는 건지 궁금해요. 어쨌든 교육에서의 AI 발전에 큰 걸음이에요!
0
HarryRoberts
2025-04-11 08:00:00
O AlphaGeometry2 da DeepMind superar os medalhistas de ouro do IMO é impressionante! É incrível ver a IA lidando com problemas tão complexos. Mas, será que ela realmente entende geometria, ou é apenas correspondência de padrões? De qualquer forma, é um grande avanço para a IA na educação!
0
BillyRoberts
2025-04-10 08:00:00
¡Que AlphaGeometry2 de DeepMind supere a los medallistas de oro del IMO es alucinante! Es increíble ver a la IA abordando problemas tan complejos. Pero, ¿realmente entiende la geometría, o solo está haciendo coincidencia de patrones? De cualquier manera, es un gran paso adelante para la IA en la educación!
0
AlbertHarris
2025-04-14 08:00:00
DeepMind's AlphaGeometry2 is mind-blowing! It's solving geometry problems better than IMO gold medalists. I used it to help with my math homework and it was spot on! The only thing is, it's a bit too advanced for casual users like me. Still, it's a solid 4 out of 5. 📚
0
Google DeepMind的最新AI Alphageometry2通過在解決國際數學奧林匹克(IMO)上解決幾何問題方面的平均金牌獲得者,從而引起了波浪。據報導,該先前發布的字母計量法的先前版本是在去年1月推出的,該版本已解決了IMO比賽的最後25年中的84%的幾何問題。
您可能想知道為什麼DeepMind專注於高中數學比賽。好吧,他們認為破解這些具有挑戰性的歐幾里得幾何問題可能是發展更先進的AI的墊腳石。解決這些問題需要邏輯推理和瀏覽各種解決方案路徑的能力,這對於未來的通用AI系統可能至關重要。
今年夏天,DeepMind展示了一個系統,該系統將Alphageometry2與Alphaproof結合使用,這是另一種用於正式數學推理的AI模型。他們一起解決了2024年IMO的六個問題中的四個。這種方法可能會超越幾何形狀到數學和科學的其他領域,例如復雜的工程計算。
Alphageometry2由一些關鍵組件提供動力,包括Google的雙子座家族的語言模型和“象徵性引擎”。雙子座模型有助於符號引擎,該引擎應用數學規則來找到解決方案,並為幾何定理創建可行的證據。
在IMO中,幾何問題通常需要在求解之前添加“構造”,例如點,線或圓圈。 Alphageometry2的雙子座模型預測,哪些構造可能會有所幫助,從而指導符號引擎進行扣除。
它的工作方式如下:雙子座模型在形式數學語言中提出了步驟和構造,然後發動機檢查邏輯一致性。 Alphageometry2使用搜索算法同時探索多個解決方案路徑,並將潛在有用的發現存儲在共享知識庫中。
當Alphageometry2將雙子座模型的建議與符號引擎的已知原理結合起來以形成完整證明時,將考慮一個問題。
由於缺乏可用的幾何訓練數據,DeepMind創建了綜合數據來訓練Alphageometry2的語言模型,產生了超過3億個定理和變化複雜性的證據。
DeepMind團隊在IMO競爭中跨越2000年至2024年的45個幾何問題測試了Alphageometry2,並將其擴展為50個問題。 Alphageometry2解決了其中的42個,超過了40.9的平均金牌得主得分。
但是,Alphageometry2具有其局限性。它在涉及可變數量的點,非線性方程和不平等的問題上掙扎。雖然這不是第一個在幾何形狀中達到金色級別性能的AI,但它是第一個使用如此大的問題進行的AI。
面對尚未在比賽中尚未出現的29個IMO提名問題的艱難集時,Alphageometry2只能解決20。
該研究的結果可能會引發有關建立AI系統的最佳方法的進一步辯論。我們是否應該專注於符號操縱,在其中AI使用規則來操縱代表知識的符號,或者是模仿人類大腦結構並從數據中學習的神經網絡?
Alphageometry2採用了混合方法,將雙子座模型的神經網絡結構與基於規則的符號引擎相結合。
神經網絡的支持者認為,智能行為可以從大量的數據和計算能力中出現。相反,符號AI支持者認為,它更適合編碼知識,通過複雜的場景和解釋解決方案。
Carnegie Mellon大學計算機科學教授Vince Conitzer專門研究AI,他評論了IMO等基準的令人印象深刻的進展與具有簡單常識性問題的語言模型的持續鬥爭之間的對比。他強調有必要更好地了解這些系統及其構成的風險。
Alphageometry2表明,將符號操縱和神經網絡結合起來可能是尋求可推廣AI的前進方式。有趣的是,DeepMind團隊發現,如果沒有符號引擎的幫助,Alphageometry2的語言模型可以為問題提供部分解決方案,這暗示了語言模型將來變得自給自足的潛力。
但是,團隊指出,直到語言速度提高並解決了幻覺之前,符號引擎等工具對於數學應用程序至關重要。




DeepMind's AlphaGeometry2 beating IMO gold medalists is mind-blowing! It's amazing to see AI tackling such complex problems. But, does it really understand geometry, or is it just pattern matching? Either way, it's a huge step forward for AI in education!




DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて驚きです!AIがこんなに複雑な問題に取り組むのを見るのは素晴らしいです。でも、本当に幾何学を理解しているのか、それともただのパターンマッチングなのか?どちらにしても、教育におけるAIの大きな一歩ですね!




DeepMind의 AlphaGeometry2가 IMO 금메달리스트를 능가하다니 놀랍네요! AI가 이렇게 복잡한 문제를 다루는 걸 보는 건 정말 멋져요. 하지만 정말 기하학을 이해하는 건지, 아니면 단순히 패턴 매칭을 하는 건지 궁금해요. 어쨌든 교육에서의 AI 발전에 큰 걸음이에요!




O AlphaGeometry2 da DeepMind superar os medalhistas de ouro do IMO é impressionante! É incrível ver a IA lidando com problemas tão complexos. Mas, será que ela realmente entende geometria, ou é apenas correspondência de padrões? De qualquer forma, é um grande avanço para a IA na educação!




¡Que AlphaGeometry2 de DeepMind supere a los medallistas de oro del IMO es alucinante! Es increíble ver a la IA abordando problemas tan complejos. Pero, ¿realmente entiende la geometría, o solo está haciendo coincidencia de patrones? De cualquier manera, es un gran paso adelante para la IA en la educación!




DeepMind's AlphaGeometry2 is mind-blowing! It's solving geometry problems better than IMO gold medalists. I used it to help with my math homework and it was spot on! The only thing is, it's a bit too advanced for casual users like me. Still, it's a solid 4 out of 5. 📚












