選項
首頁
新聞
DeepMind的AI在2025年數學奧林匹克奪金

DeepMind的AI在2025年數學奧林匹克奪金

2025-08-22
137

DeepMind的AI在數學推理上實現驚人突破,在2025年國際數學奧林匹克(IMO)奪得金牌,僅一年後即從2024年的銀牌躍升。此突破凸顯AI在解決需要人類創意的複雜抽象問題上的成長實力。本文探討DeepMind的轉型歷程、關鍵技術進展及此里程碑的廣泛影響。

國際數學奧林匹克的重要性

自1959年起,國際數學奧林匹克一直是全球頂尖的高中生數學競賽。它以代數、幾何、數論及組合數學的六道複雜題目挑戰參賽者,需展現卓越的創造力、邏輯及優雅的證明。

對AI而言,國際數學奧林匹克是一項艱鉅考驗。不同於模式識別或圍棋等策略遊戲,奧林匹克數學需要抽象推理及新穎想法的合成——這些長期被認為是人類獨有的技能。因此,國際數學奧林匹克成為衡量AI朝人類智能進展的基準。

2024年的銀牌里程碑

2024年,DeepMind推出兩款針對國際數學奧林匹克問題的AI系統:AlphaProof及AlphaGeometry 2,均採用「神經-符號」AI,結合大型語言模型(LLMs)與符號邏輯。

AlphaProof使用Lean(一種形式化數學語言)進行證明。它整合DeepMind的大型語言模型Gemini與以掌握棋盤遊戲聞名的強化學習系統AlphaZero。Gemini將問題翻譯成Lean,生成邏輯步驟,而AlphaProof則在數百萬多樣化數學問題上訓練,透過自我改進精進技能。

AlphaGeometry 2在幾何學表現卓越,Gemini預測輔助構造,符號引擎處理推導。此混合方法使其能解決複雜幾何問題。

這兩個系統解決了六道國際數學奧林匹克題目中的四道——代數兩道、數論一道、幾何一道,得分28/42,獲得銀牌。這標誌著AI的歷史性成就,儘管依賴人類翻譯及大量計算資源。

奪金的關鍵創新

DeepMind在2025年躍升至金牌,源於重大技術進展。

1. 自然語言證明

關鍵轉變是使用自然語言進行證明,無需專家將問題翻譯成形式化語言。升級版Gemini具備Deep Think功能,可直接處理問題,草擬非正式證明,內部形式化關鍵步驟,並提供清晰的英文證明。透過人類反饋的強化學習(RLHF)確保簡潔、邏輯的解法。

Gemini Deep Think以更長的上下文窗口及更多計算資源支援多頁推理。它採用平行推理,生成數百條解決路徑,由監督者排序最佳路徑,類似人類腦力激盪。

2. 先進訓練技術

Gemini Deep Think在來自數學論壇、arXiv及大學問題集的10萬個解題語料庫上進行微調,由人類導師過濾錯誤。透過對驗證子引理的逐步獎勵強化學習,引導模型生成簡潔證明。訓練歷時三個月,使用2500萬TPU小時。

3. 平行處理能力

平行化至關重要,多條推理分支同時探索。資源動態轉向有前景的路徑,特別適用於組合數學。此方法由DeepMind的TPU v5叢集支援,類似人類在完整證明前測試不等式的策略。

DeepMind在2025年國際數學奧林匹克的勝利

為確保公平,DeepMind在比賽前三週凍結模型權重,過濾未公開的問題解法。比賽期間,Gemini Deep Think在無網路連線下處理六道純文字題目,使用相當於筆電的計算能力。它在三小時內完成證明,五道題目獲得滿分,總分35/42,奪得金牌。AI的證明被讚為嚴謹且徹底,符合人類標準。

對AI與數學的影響

DeepMind的成功顯示AI朝人工通用智能(AGI)的進展,因國際數學奧林匹克問題需要高級推理。對數學而言,Gemini Deep Think等AI工具可協助探索新定理、驗證猜想及簡化證明,讓數學家專注於概念性工作。然而,AI在教育及競賽中的角色引發了對未來結構的討論。

未來展望

儘管某些數學挑戰仍存,DeepMind的快速進展表明AI可能很快能應對重大未解問題。2025年國際數學奧林匹克的勝利凸顯AI邏輯推理的進步,引發關於AI將補充或重新定義人類數學創意的討論。

相關文章
如何保護資產、建築物及個人健康? 如何保護資產、建築物及個人健康? 在這個充滿變數的世界裡,保障已不再僅是選項,而是戰略上的必要之舉。無論是守護財務、強化建築結構,還是關注個人健康,長期的穩定都仰賴於主動規劃。真正的安全是多層次的,取決於財務管理、結構韌性與明智的健康意識三者相輔相成。守護最重要的事物,意味著必須未雨綢繆,而非僅在損害發生後才做出反應。財務保障:第一道防線每個人與每家企業都運作於財務架構之中。收入、支出、負債與投資構成了穩定的基石。若缺乏有條不紊的
AI 瀏覽器 Comet 正式上線,在 iPad 上全面支援多工處理 AI 瀏覽器 Comet 正式上線,在 iPad 上全面支援多工處理 Perplexity 的 AI 瀏覽器 Comet 已正式推出 iPad 版本,現已全面相容於 iPadOS。此次更新導入多視窗瀏覽功能、多工處理支援,並與 OpenAI 和 Anthropic 等頂尖 AI 模型深度整合,帶來更智能的網路體驗。Comet 瀏覽器拓展了使用者探索網路及與 AI 聊天機器人互動的方式,提供直觀的管道存取 OpenAI 和 Anthropic 等頂尖 AI 模型,以進
Trace籌集了300萬美元,用於解決企業採用AI智慧助手時所遇到的各種障礙。 Trace籌集了300萬美元,用於解決企業採用AI智慧助手時所遇到的各種障礙。 儘管人工智慧代理具有巨大潛力,但它們在企業中仍難以取得實質性進展。一家新興的初創企業認為,根本問題在於缺乏上下文資訊。Trace是一家專注於工作流程協作的初創企業,它作為Y Combinator 2025年夏季培訓專案的一部分誕生,旨在彌補這一空白。該公司能夠梳理複雜的企業環境和業務流程,為人工智慧代理提供所需的上下文資訊,從而幫助它們快速發展。“OpenAI和Anthropic培養出了非常優秀的人工智慧實習生,企業完全可以利用這些資源,”Trace的執行長Tim Cherkasov解釋
相關專題推薦
商業 頂尖 AI 定價優化軟體:追蹤競爭對手並自動調整商店價格
頂尖 AI 定價優化軟體:追蹤競爭對手並自動調整商店價格

立即在 XIX.AI 探索 2026 年最佳 AI 定價優化軟體。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的工具,這些工具不僅能追蹤競爭對手,還能自動調整您的商店價格,以實現利潤最大化。透過實際測試,比較免費與付費方案的差異。立即掌握您的定價優勢。

10 個工具
xix.ai
代碼 最佳 AI 程式碼審查工具:自動化確保程式碼整潔度,並重構舊版儲存庫檔案
最佳 AI 程式碼審查工具:自動化確保程式碼整潔度,並重構舊版儲存庫檔案

立即在 XIX.AI 探索 2026 年最佳 AI 程式碼審查工具。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的工具,可自動確保程式碼符合規範,並重構舊版儲存庫檔案。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即掌握您的 AI 競爭優勢。

10 個工具
xix.ai
文字轉語音 專為閱讀障礙設計的頂尖 AI 語音合成應用程式:協助學生提升學習與閱讀效率
專為閱讀障礙設計的頂尖 AI 語音合成應用程式:協助學生提升學習與閱讀效率

探索 2026 年最新精選、專為閱讀障礙者設計的頂級 AI 語音合成(TTS)應用程式。我們的專家評比將免費與付費工具進行對照,重點介紹能提升閱讀效率與學習成效的強大功能。發掘這些必試且能帶來革命性改變的解決方案,釋放學生的潛能。立即前往 XIX.AI 展開您的探索之旅。

10 個工具
xix.ai
漫畫創作 少年漫畫頂尖 AI 生成器:打造高張力動作場面與能量特效
少年漫畫頂尖 AI 生成器:打造高張力動作場面與能量特效

立即前往 XIX.AI,探索 2026 年最優秀的少年漫畫 AI 生成工具。我們精心挑選的頂級清單,匯集了能打造高張力動作場面與動態能量特效的強大工具。透過實際測試,比較免費與付費選項的差異。釋放您的創作潛能,今天就開始打造史詩級漫畫吧!

15 個工具
xix.ai
商業 最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支
最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支

2026 年最新最佳 AI 報銷管理工具:備受好評的解決方案,可自動掃描收據並分類企業支出。探索強大且顛覆傳統的解決方案,助您輕鬆管理報銷、精準追蹤財務,並簡化合規流程。我們精心整理並每週更新的免費與付費方案比較指南,將協助您找到最合適的選擇。透過 XIX.AI 的專家精選,釋放您的 AI 優勢。

10 個工具
xix.ai
商業 最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試
最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案,可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即找到最適合您的招聘助手,並優化您的招聘流程!

10 個工具
xix.ai
評論 (1)
0/500
StevenGreen
StevenGreen 2026-02-23 12:00:40

¿Un AI ganando oro en la IMO? 😳 Esto es increíble, pero también me preocupa un poco. Si ya supera a los mejores matemáticos humanos, ¿qué pasará con la educación? ¿Deberíamos replantearnos cómo enseñamos matemáticas en el futuro? Al mismo tiempo, es fascinante ver hasta dónde puede llegar la IA.

OR