DeepMind的AI在2025年數學奧林匹克奪金
DeepMind的AI在數學推理上實現驚人突破,在2025年國際數學奧林匹克(IMO)奪得金牌,僅一年後即從2024年的銀牌躍升。此突破凸顯AI在解決需要人類創意的複雜抽象問題上的成長實力。本文探討DeepMind的轉型歷程、關鍵技術進展及此里程碑的廣泛影響。
國際數學奧林匹克的重要性
自1959年起,國際數學奧林匹克一直是全球頂尖的高中生數學競賽。它以代數、幾何、數論及組合數學的六道複雜題目挑戰參賽者,需展現卓越的創造力、邏輯及優雅的證明。
對AI而言,國際數學奧林匹克是一項艱鉅考驗。不同於模式識別或圍棋等策略遊戲,奧林匹克數學需要抽象推理及新穎想法的合成——這些長期被認為是人類獨有的技能。因此,國際數學奧林匹克成為衡量AI朝人類智能進展的基準。
2024年的銀牌里程碑
2024年,DeepMind推出兩款針對國際數學奧林匹克問題的AI系統:AlphaProof及AlphaGeometry 2,均採用「神經-符號」AI,結合大型語言模型(LLMs)與符號邏輯。
AlphaProof使用Lean(一種形式化數學語言)進行證明。它整合DeepMind的大型語言模型Gemini與以掌握棋盤遊戲聞名的強化學習系統AlphaZero。Gemini將問題翻譯成Lean,生成邏輯步驟,而AlphaProof則在數百萬多樣化數學問題上訓練,透過自我改進精進技能。
AlphaGeometry 2在幾何學表現卓越,Gemini預測輔助構造,符號引擎處理推導。此混合方法使其能解決複雜幾何問題。
這兩個系統解決了六道國際數學奧林匹克題目中的四道——代數兩道、數論一道、幾何一道,得分28/42,獲得銀牌。這標誌著AI的歷史性成就,儘管依賴人類翻譯及大量計算資源。
奪金的關鍵創新
DeepMind在2025年躍升至金牌,源於重大技術進展。
1. 自然語言證明
關鍵轉變是使用自然語言進行證明,無需專家將問題翻譯成形式化語言。升級版Gemini具備Deep Think功能,可直接處理問題,草擬非正式證明,內部形式化關鍵步驟,並提供清晰的英文證明。透過人類反饋的強化學習(RLHF)確保簡潔、邏輯的解法。
Gemini Deep Think以更長的上下文窗口及更多計算資源支援多頁推理。它採用平行推理,生成數百條解決路徑,由監督者排序最佳路徑,類似人類腦力激盪。
2. 先進訓練技術
Gemini Deep Think在來自數學論壇、arXiv及大學問題集的10萬個解題語料庫上進行微調,由人類導師過濾錯誤。透過對驗證子引理的逐步獎勵強化學習,引導模型生成簡潔證明。訓練歷時三個月,使用2500萬TPU小時。
3. 平行處理能力
平行化至關重要,多條推理分支同時探索。資源動態轉向有前景的路徑,特別適用於組合數學。此方法由DeepMind的TPU v5叢集支援,類似人類在完整證明前測試不等式的策略。
DeepMind在2025年國際數學奧林匹克的勝利
為確保公平,DeepMind在比賽前三週凍結模型權重,過濾未公開的問題解法。比賽期間,Gemini Deep Think在無網路連線下處理六道純文字題目,使用相當於筆電的計算能力。它在三小時內完成證明,五道題目獲得滿分,總分35/42,奪得金牌。AI的證明被讚為嚴謹且徹底,符合人類標準。
對AI與數學的影響
DeepMind的成功顯示AI朝人工通用智能(AGI)的進展,因國際數學奧林匹克問題需要高級推理。對數學而言,Gemini Deep Think等AI工具可協助探索新定理、驗證猜想及簡化證明,讓數學家專注於概念性工作。然而,AI在教育及競賽中的角色引發了對未來結構的討論。
未來展望
儘管某些數學挑戰仍存,DeepMind的快速進展表明AI可能很快能應對重大未解問題。2025年國際數學奧林匹克的勝利凸顯AI邏輯推理的進步,引發關於AI將補充或重新定義人類數學創意的討論。
相關文章
AI驅動的視差製作工具:打造動態2.5D動畫
將靜態圖像轉化為引人入勝的2.5D動畫,使用Parallax Maker。此開源工具賦予藝術家和遊戲開發者為其作品注入深度與動態的能力。透過利用Stability AI API,Parallax Maker確保即使在普通硬體上也能實現流暢的工作流程。探索此工具的功能以及如何提升您的創意項目。主要亮點Parallax Maker是一個用於製作2.5D動畫的開源解決方案。它將圖像轉化為與Blender
Trunk Tools 獲得4000萬美元推進AI驅動的建築解決方案
Trunk Tools,一家改變建築專業人士管理和利用項目數據方式的AI創新公司,已在B輪融資中籌集了4000萬美元。本輪融資由Insight Partners領投,Redpoint Ventures、Innovation Endeavors、Stepstone、Liberty Mutual Strategic Ventures和Prudence參與,公司總資本達到7000萬美元。全球建築行業價值
AI驅動的房地產廣告:透過Likely AI提升潛在客戶品質
在當今快節奏的房地產市場中,差異化是關鍵。Likely AI的廣告創建工具利用人工智能打造高度針對性、影響力強的廣告活動,改變了行銷方式。此創新工具簡化廣告創作流程,使房地產專業人士能夠與理想受眾建立聯繫,並以卓越效率生成高品質潛在客戶。有了Likely AI,焦點從數量轉向價值,確保您的訊息在最佳時刻觸及正確對象。主要亮點Likely AI的廣告創建工具利用AI生成量身定制的房地產廣告。它通過滿
評論 (0)
0/200
DeepMind的AI在數學推理上實現驚人突破,在2025年國際數學奧林匹克(IMO)奪得金牌,僅一年後即從2024年的銀牌躍升。此突破凸顯AI在解決需要人類創意的複雜抽象問題上的成長實力。本文探討DeepMind的轉型歷程、關鍵技術進展及此里程碑的廣泛影響。
國際數學奧林匹克的重要性
自1959年起,國際數學奧林匹克一直是全球頂尖的高中生數學競賽。它以代數、幾何、數論及組合數學的六道複雜題目挑戰參賽者,需展現卓越的創造力、邏輯及優雅的證明。
對AI而言,國際數學奧林匹克是一項艱鉅考驗。不同於模式識別或圍棋等策略遊戲,奧林匹克數學需要抽象推理及新穎想法的合成——這些長期被認為是人類獨有的技能。因此,國際數學奧林匹克成為衡量AI朝人類智能進展的基準。
2024年的銀牌里程碑
2024年,DeepMind推出兩款針對國際數學奧林匹克問題的AI系統:AlphaProof及AlphaGeometry 2,均採用「神經-符號」AI,結合大型語言模型(LLMs)與符號邏輯。
AlphaProof使用Lean(一種形式化數學語言)進行證明。它整合DeepMind的大型語言模型Gemini與以掌握棋盤遊戲聞名的強化學習系統AlphaZero。Gemini將問題翻譯成Lean,生成邏輯步驟,而AlphaProof則在數百萬多樣化數學問題上訓練,透過自我改進精進技能。
AlphaGeometry 2在幾何學表現卓越,Gemini預測輔助構造,符號引擎處理推導。此混合方法使其能解決複雜幾何問題。
這兩個系統解決了六道國際數學奧林匹克題目中的四道——代數兩道、數論一道、幾何一道,得分28/42,獲得銀牌。這標誌著AI的歷史性成就,儘管依賴人類翻譯及大量計算資源。
奪金的關鍵創新
DeepMind在2025年躍升至金牌,源於重大技術進展。
1. 自然語言證明
關鍵轉變是使用自然語言進行證明,無需專家將問題翻譯成形式化語言。升級版Gemini具備Deep Think功能,可直接處理問題,草擬非正式證明,內部形式化關鍵步驟,並提供清晰的英文證明。透過人類反饋的強化學習(RLHF)確保簡潔、邏輯的解法。
Gemini Deep Think以更長的上下文窗口及更多計算資源支援多頁推理。它採用平行推理,生成數百條解決路徑,由監督者排序最佳路徑,類似人類腦力激盪。
2. 先進訓練技術
Gemini Deep Think在來自數學論壇、arXiv及大學問題集的10萬個解題語料庫上進行微調,由人類導師過濾錯誤。透過對驗證子引理的逐步獎勵強化學習,引導模型生成簡潔證明。訓練歷時三個月,使用2500萬TPU小時。
3. 平行處理能力
平行化至關重要,多條推理分支同時探索。資源動態轉向有前景的路徑,特別適用於組合數學。此方法由DeepMind的TPU v5叢集支援,類似人類在完整證明前測試不等式的策略。
DeepMind在2025年國際數學奧林匹克的勝利
為確保公平,DeepMind在比賽前三週凍結模型權重,過濾未公開的問題解法。比賽期間,Gemini Deep Think在無網路連線下處理六道純文字題目,使用相當於筆電的計算能力。它在三小時內完成證明,五道題目獲得滿分,總分35/42,奪得金牌。AI的證明被讚為嚴謹且徹底,符合人類標準。
對AI與數學的影響
DeepMind的成功顯示AI朝人工通用智能(AGI)的進展,因國際數學奧林匹克問題需要高級推理。對數學而言,Gemini Deep Think等AI工具可協助探索新定理、驗證猜想及簡化證明,讓數學家專注於概念性工作。然而,AI在教育及競賽中的角色引發了對未來結構的討論。
未來展望
儘管某些數學挑戰仍存,DeepMind的快速進展表明AI可能很快能應對重大未解問題。2025年國際數學奧林匹克的勝利凸顯AI邏輯推理的進步,引發關於AI將補充或重新定義人類數學創意的討論。












