DeepMind的AI優於IMO金牌得主
Google DeepMind 的最新 AI,AlphaGeometry2,通過在國際數學奧林匹克(IMO)幾何問題解決中超越平均金牌得主的表現引起轟動。此為去年一月推出的 AlphaGeometry 進階版,據報導解決了过去 25 年 IMO 競賽中 84% 的幾何問題。
你可能好奇為何 DeepMind 專注於高中數學競賽。他們認為,破解這些具有挑戰性的歐幾里得幾何問題可能是發展更先進 AI 的墊腳石。解決這些問題需要邏輯推理和探索多種解題路徑的能力,這些技能對未來通用 AI 系統至關重要。
今年夏天,DeepMind 展示了一個結合 AlphaGeometry2 與 AlphaProof 的系統,後者是專為形式數學推理設計的另一 AI 模型。兩者共同解決了 2024 年 IMO 的六道題目中的四道。此方法可能延伸至數學與科學的其他領域,如複雜工程計算。
AlphaGeometry2 由幾個關鍵組件驅動,包括來自 Google Gemini 家族的語言模型和一個「符號引擎」。Gemini 模型協助符號引擎應用數學規則尋找解法,為幾何定理生成可行證明。

IMO 考試中的典型幾何問題圖表。圖片來源:Google(在新視窗中開啟) 在 IMO 中,幾何問題通常要求在圖表中添加「構造」,如點、線或圓,然後再解決問題。AlphaGeometry2 的 Gemini 模型預測哪些構造可能有幫助,引導符號引擎進行推導。
運作方式如下:Gemini 模型以形式數學語言建議步驟和構造,引擎隨後檢查其邏輯一致性。AlphaGeometry2 使用搜尋演算法同時探索多個解題路徑,並將可能有用的發現儲存在共享知識庫中。
當 AlphaGeometry2 結合 Gemini 模型的建議與符號引擎的已知原理形成完整證明時,問題被視為「已解決」。
由於可用幾何訓練數據稀缺,DeepMind 創建了合成數據來訓練 AlphaGeometry2 的語言模型,生成了超過 3 億個不同複雜度的定理和證明。
DeepMind 團隊在 2000 至 2024 年 IMO 競賽的 45 道幾何問題(擴展為 50 道)上測試了 AlphaGeometry2,它解決了 42 道,超越平均金牌得主分數 40.9。
然而,AlphaGeometry2 有其局限性。它在涉及變量點數、非線性方程和不等式的問題上表現不佳。雖然它不是首個達到金牌水平的 AI,但它是首個在如此大量問題集上實現此成績的 AI。
在面對 29 道尚未出現在競賽中的 IMO 提名問題時,AlphaGeometry2 僅解決了 20 道。
研究結果可能引發關於構建 AI 系統最佳方法的進一步爭論。我們應專注於符號操作(AI 使用規則操作代表知識的符號),還是神經網絡(模仿人腦結構並從數據學習)?
AlphaGeometry2 採用混合方法,結合 Gemini 模型的神經網絡架構與基於規則的符號引擎。
神經網絡支持者認為,智能行為可從大量數據和計算能力中湧現。相反,符號 AI 支持者認為它更適合編碼知識、推理複雜場景並解釋解法。
卡內基梅隆大學專攻 AI 的電腦科學教授 Vince Conitzer 評論了 IMO 等基準測試的顯著進展與語言模型在簡單常識問題上的持續掙扎之間的對比。他強調需要更好地理解這些系統及其潛在風險。
AlphaGeometry2 表明,結合符號操作與神經網絡可能是實現通用 AI 的有前景路徑。有趣的是,DeepMind 團隊發現 AlphaGeometry2 的語言模型可在無符號引擎幫助下生成部分問題解法,暗示語言模型未來可能實現自給自足。
然而,團隊指出,在語言模型速度提升和幻覺問題解決之前,符號引擎等工具對數學應用仍不可或缺。
相關文章
Google 揭曉量產級 Gemini 2.5 AI 模型以在企業市場與 OpenAI 競爭
Google 於週一強化其 AI 策略,推出先進的 Gemini 2.5 模型供企業使用,並引入成本效益高的變體,以在價格與性能上競爭。Alphabet 旗下的公司將其旗艦 AI 模型—Gemini 2.5 Pro 與 Gemini 2.5 Flash—從測試階段提升至全面可用,展示其適用於關鍵業務應用的準備度。同時,Google 推出 Gemini 2.5 Flash-Lite,定位為高量任務中
Meta增強AI安全以先進Llama工具
Meta已發布全新Llama安全工具,以強化AI開發並防範新興威脅。這些升級的Llama AI模型安全工具與Meta的新資源搭配,旨在賦能網路安全團隊利用AI進行防禦,提升所有AI利益相關者的安全性。使用Llama模型的開發者現可直接在Meta的Llama Protections頁面、Hugging Face及GitHub上獲得增強工具。Llama Guard 4引入多模態功能,支持文字與圖像的安
NotebookLM推出頂尖出版物與專家精選筆記本
Google正在增強其AI驅動的研究與筆記工具NotebookLM,使其成為一個全面的知識中心。週一,該公司推出了一個由知名作者、出版物、研究人員和非營利組織提供的精選筆記本集合,讓使用者能夠探索健康、旅遊、財經等多樣化主題。首批內容包括來自《經濟學人》、《大西洋月刊》、知名教授、作者,甚至莎士比亞作品的貢獻,展示NotebookLM在深入主題探索中的實際應用。Google解釋說,使用者可以存取原
評論 (27)
0/200
AlbertSmith
2025-08-10 05:00:59
Wow, AlphaGeometry2 is killing it at IMO geometry problems! Beating gold medalists is wild—makes me wonder if AI will soon design math contests instead of just solving them. 😮
0
JackCarter
2025-07-28 10:13:31
This AI beating IMO champs is wild! 🤯 Makes me wonder if it could tutor me in math or just take over the world one proof at a time.
0
LarryMartin
2025-04-20 17:52:37
AlphaGeometry2는 정말 놀랍네요! IMO 기하 문제를 금메달리스트보다 더 잘 풀어요. 하지만 저는 수학 천재가 아니라서 마술 쇼를 보는 기분이에요. 좀 더 이해할 수 있으면 좋겠어요! 🤯
0
JerryGonzález
2025-04-17 07:58:03
DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて信じられない!まるでAIが人間より賢いSF映画を見ているよう。でも本当に、私の宿題を手伝ってくれるのかな?😂
0
RaymondBaker
2025-04-16 19:21:57
AlphaGeometry2 is mind-blowing! It's solving IMO geometry problems better than gold medalists. But I'm no math whiz, so it's more like watching a magic show for me. Wish I could understand it better! 🤯
0
JonathanAllen
2025-04-16 16:15:26
AlphaGeometry2 é impressionante! Resolve problemas de geometria do IMO melhor que medalhistas de ouro. Mas eu não sou um gênio em matemática, então pra mim é como assistir a um show de mágica. Queria entender melhor! 🤯
0
Google DeepMind 的最新 AI,AlphaGeometry2,通過在國際數學奧林匹克(IMO)幾何問題解決中超越平均金牌得主的表現引起轟動。此為去年一月推出的 AlphaGeometry 進階版,據報導解決了过去 25 年 IMO 競賽中 84% 的幾何問題。
你可能好奇為何 DeepMind 專注於高中數學競賽。他們認為,破解這些具有挑戰性的歐幾里得幾何問題可能是發展更先進 AI 的墊腳石。解決這些問題需要邏輯推理和探索多種解題路徑的能力,這些技能對未來通用 AI 系統至關重要。
今年夏天,DeepMind 展示了一個結合 AlphaGeometry2 與 AlphaProof 的系統,後者是專為形式數學推理設計的另一 AI 模型。兩者共同解決了 2024 年 IMO 的六道題目中的四道。此方法可能延伸至數學與科學的其他領域,如複雜工程計算。
AlphaGeometry2 由幾個關鍵組件驅動,包括來自 Google Gemini 家族的語言模型和一個「符號引擎」。Gemini 模型協助符號引擎應用數學規則尋找解法,為幾何定理生成可行證明。
在 IMO 中,幾何問題通常要求在圖表中添加「構造」,如點、線或圓,然後再解決問題。AlphaGeometry2 的 Gemini 模型預測哪些構造可能有幫助,引導符號引擎進行推導。
運作方式如下:Gemini 模型以形式數學語言建議步驟和構造,引擎隨後檢查其邏輯一致性。AlphaGeometry2 使用搜尋演算法同時探索多個解題路徑,並將可能有用的發現儲存在共享知識庫中。
當 AlphaGeometry2 結合 Gemini 模型的建議與符號引擎的已知原理形成完整證明時,問題被視為「已解決」。
由於可用幾何訓練數據稀缺,DeepMind 創建了合成數據來訓練 AlphaGeometry2 的語言模型,生成了超過 3 億個不同複雜度的定理和證明。
DeepMind 團隊在 2000 至 2024 年 IMO 競賽的 45 道幾何問題(擴展為 50 道)上測試了 AlphaGeometry2,它解決了 42 道,超越平均金牌得主分數 40.9。
然而,AlphaGeometry2 有其局限性。它在涉及變量點數、非線性方程和不等式的問題上表現不佳。雖然它不是首個達到金牌水平的 AI,但它是首個在如此大量問題集上實現此成績的 AI。
在面對 29 道尚未出現在競賽中的 IMO 提名問題時,AlphaGeometry2 僅解決了 20 道。
研究結果可能引發關於構建 AI 系統最佳方法的進一步爭論。我們應專注於符號操作(AI 使用規則操作代表知識的符號),還是神經網絡(模仿人腦結構並從數據學習)?
AlphaGeometry2 採用混合方法,結合 Gemini 模型的神經網絡架構與基於規則的符號引擎。
神經網絡支持者認為,智能行為可從大量數據和計算能力中湧現。相反,符號 AI 支持者認為它更適合編碼知識、推理複雜場景並解釋解法。
卡內基梅隆大學專攻 AI 的電腦科學教授 Vince Conitzer 評論了 IMO 等基準測試的顯著進展與語言模型在簡單常識問題上的持續掙扎之間的對比。他強調需要更好地理解這些系統及其潛在風險。
AlphaGeometry2 表明,結合符號操作與神經網絡可能是實現通用 AI 的有前景路徑。有趣的是,DeepMind 團隊發現 AlphaGeometry2 的語言模型可在無符號引擎幫助下生成部分問題解法,暗示語言模型未來可能實現自給自足。
然而,團隊指出,在語言模型速度提升和幻覺問題解決之前,符號引擎等工具對數學應用仍不可或缺。


Wow, AlphaGeometry2 is killing it at IMO geometry problems! Beating gold medalists is wild—makes me wonder if AI will soon design math contests instead of just solving them. 😮




This AI beating IMO champs is wild! 🤯 Makes me wonder if it could tutor me in math or just take over the world one proof at a time.




AlphaGeometry2는 정말 놀랍네요! IMO 기하 문제를 금메달리스트보다 더 잘 풀어요. 하지만 저는 수학 천재가 아니라서 마술 쇼를 보는 기분이에요. 좀 더 이해할 수 있으면 좋겠어요! 🤯




DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて信じられない!まるでAIが人間より賢いSF映画を見ているよう。でも本当に、私の宿題を手伝ってくれるのかな?😂




AlphaGeometry2 is mind-blowing! It's solving IMO geometry problems better than gold medalists. But I'm no math whiz, so it's more like watching a magic show for me. Wish I could understand it better! 🤯




AlphaGeometry2 é impressionante! Resolve problemas de geometria do IMO melhor que medalhistas de ouro. Mas eu não sou um gênio em matemática, então pra mim é como assistir a um show de mágica. Queria entender melhor! 🤯












