選項
首頁
新聞
DeepMind的AI優於IMO金牌得主

DeepMind的AI優於IMO金牌得主

2025-04-10
220

Google DeepMind 的最新 AI,AlphaGeometry2,通過在國際數學奧林匹克(IMO)幾何問題解決中超越平均金牌得主的表現引起轟動。此為去年一月推出的 AlphaGeometry 進階版,據報導解決了过去 25 年 IMO 競賽中 84% 的幾何問題。

你可能好奇為何 DeepMind 專注於高中數學競賽。他們認為,破解這些具有挑戰性的歐幾里得幾何問題可能是發展更先進 AI 的墊腳石。解決這些問題需要邏輯推理和探索多種解題路徑的能力,這些技能對未來通用 AI 系統至關重要。

今年夏天,DeepMind 展示了一個結合 AlphaGeometry2 與 AlphaProof 的系統,後者是專為形式數學推理設計的另一 AI 模型。兩者共同解決了 2024 年 IMO 的六道題目中的四道。此方法可能延伸至數學與科學的其他領域,如複雜工程計算。

AlphaGeometry2 由幾個關鍵組件驅動,包括來自 Google Gemini 家族的語言模型和一個「符號引擎」。Gemini 模型協助符號引擎應用數學規則尋找解法,為幾何定理生成可行證明。

IMO 中的典型幾何圖表。

IMO 考試中的典型幾何問題圖表。圖片來源:Google(在新視窗中開啟)

在 IMO 中,幾何問題通常要求在圖表中添加「構造」,如點、線或圓,然後再解決問題。AlphaGeometry2 的 Gemini 模型預測哪些構造可能有幫助,引導符號引擎進行推導。

運作方式如下:Gemini 模型以形式數學語言建議步驟和構造,引擎隨後檢查其邏輯一致性。AlphaGeometry2 使用搜尋演算法同時探索多個解題路徑,並將可能有用的發現儲存在共享知識庫中。

當 AlphaGeometry2 結合 Gemini 模型的建議與符號引擎的已知原理形成完整證明時,問題被視為「已解決」。

由於可用幾何訓練數據稀缺,DeepMind 創建了合成數據來訓練 AlphaGeometry2 的語言模型,生成了超過 3 億個不同複雜度的定理和證明。

DeepMind 團隊在 2000 至 2024 年 IMO 競賽的 45 道幾何問題(擴展為 50 道)上測試了 AlphaGeometry2,它解決了 42 道,超越平均金牌得主分數 40.9。

然而,AlphaGeometry2 有其局限性。它在涉及變量點數、非線性方程和不等式的問題上表現不佳。雖然它不是首個達到金牌水平的 AI,但它是首個在如此大量問題集上實現此成績的 AI。

在面對 29 道尚未出現在競賽中的 IMO 提名問題時,AlphaGeometry2 僅解決了 20 道。

研究結果可能引發關於構建 AI 系統最佳方法的進一步爭論。我們應專注於符號操作(AI 使用規則操作代表知識的符號),還是神經網絡(模仿人腦結構並從數據學習)?

AlphaGeometry2 採用混合方法,結合 Gemini 模型的神經網絡架構與基於規則的符號引擎。

神經網絡支持者認為,智能行為可從大量數據和計算能力中湧現。相反,符號 AI 支持者認為它更適合編碼知識、推理複雜場景並解釋解法。

卡內基梅隆大學專攻 AI 的電腦科學教授 Vince Conitzer 評論了 IMO 等基準測試的顯著進展與語言模型在簡單常識問題上的持續掙扎之間的對比。他強調需要更好地理解這些系統及其潛在風險。

AlphaGeometry2 表明,結合符號操作與神經網絡可能是實現通用 AI 的有前景路徑。有趣的是,DeepMind 團隊發現 AlphaGeometry2 的語言模型可在無符號引擎幫助下生成部分問題解法,暗示語言模型未來可能實現自給自足。

然而,團隊指出,在語言模型速度提升和幻覺問題解決之前,符號引擎等工具對數學應用仍不可或缺。

相關文章
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能 WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能 廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
Kakao Mobility 概述了針對實體人工智慧的第 4 級自動駕駛路線圖 Kakao Mobility 概述了針對實體人工智慧的第 4 級自動駕駛路線圖 Kakao Mobility 計畫內部開發第 4 級自動駕駛技術,作為其實體人工智慧策略的一環。在首爾COEX舉行的2026年世界資訊科技展(World IT Show)會議上,Kakao Mobility副總裁兼實體AI部門負責人金鎮奎(Kim Jin-kyu)發表了該發展藍圖。他的演講聚焦於實體AI時代以移動平台為核心的自動駕駛服務。據韓聯社報導,這場名為「超越構想,付諸行動:AI 推動現
Google 在印度的 Chrome 瀏覽器中推出 Gemini Google 在印度的 Chrome 瀏覽器中推出 Gemini 週三,Google 宣布將把 Chrome 瀏覽器的 Gemini 整合功能擴展至新地區,包括印度、加拿大和新西蘭。此項更新讓桌面版使用者能透過側邊欄存取 Gemini,藉此向 Google 的 AI 聊天機器人詢問螢幕上的內容、從 Gmail、Keep、Drive 和 YouTube 檢索資訊,以及比較不同分頁的內容。隨著此次擴展,Gemini 除英語及近期新增的 Chrome 支援語言外,亦將
相關專題推薦
漫畫創作 少年漫畫頂尖 AI 生成器:打造高張力動作場面與能量特效
少年漫畫頂尖 AI 生成器:打造高張力動作場面與能量特效

立即前往 XIX.AI,探索 2026 年最優秀的少年漫畫 AI 生成工具。我們精心挑選的頂級清單,匯集了能打造高張力動作場面與動態能量特效的強大工具。透過實際測試,比較免費與付費選項的差異。釋放您的創作潛能,今天就開始打造史詩級漫畫吧!

15 個工具
xix.ai
商業 最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支
最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支

2026 年最新最佳 AI 報銷管理工具:備受好評的解決方案,可自動掃描收據並分類企業支出。探索強大且顛覆傳統的解決方案,助您輕鬆管理報銷、精準追蹤財務,並簡化合規流程。我們精心整理並每週更新的免費與付費方案比較指南,將協助您找到最合適的選擇。透過 XIX.AI 的專家精選,釋放您的 AI 優勢。

10 個工具
xix.ai
商業 最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試
最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案,可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即找到最適合您的招聘助手,並優化您的招聘流程!

10 個工具
xix.ai
生產率 AI 個人健康與專注力教練:管理倦怠感並提升精神能量
AI 個人健康與專注力教練:管理倦怠感並提升精神能量

立即在 XIX.AI 探索 2026 年最佳 AI 個人健康與專注力教練。我們精心策劃的排行榜收錄了備受好評、能帶來革命性改變的工具,助您管理倦怠感並提升精神能量。透過實際使用心得,比較免費與付費方案的差異。立即開啟通往巔峰生產力與身心健康的道路。

10 個工具
xix.ai
聊天機器人 最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係
最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係

探索 2026 年最新、評價最高的 AI 浪漫聊天機器人,助您建立真摯且長久的連結。我們精心整理的清單包含功能強大且性格鮮明的聊天機器人、免費與付費版本的比較,以及實際測試結果。立即前往 XIX.AI 尋找您的完美伴侶,並開始建立這段關係吧。

10 個工具
xix.ai
教育與學習 最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程
最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程

探索2026年最優秀的人工智慧資料科學導師,幫助他們掌握SQL、Pandas以及機器學習工作流程。在XIX.AI上檢視我們精心挑選的頂級導師名單,獲得強大而具有變革性的指導。透過對比免費和付費選項,並結合實際應用案例進行了解,今天就開啟你的資料科學精通之路吧。

10 個工具
xix.ai
評論 (34)
0/500
DonaldAdams
DonaldAdams 2026-04-13 04:00:40

AlphaGeometry2這表現也太猛了吧!直接超越IMO金牌平均水準,感覺數學競賽的未來要徹底改寫了。不過AI在幾何證明上這麼強,以後學生還需要苦練那些輔助線技巧嗎?🤔 既期待又怕被取代啊...

AnthonyMoore
AnthonyMoore 2025-12-03 04:30:32

C'est impressionnant de voir à quelle vitesse AlphaGeometry2 a été développé après la première version ! 😮 Mais je me demande comment cela se traduirait dans le monde réel, au-delà des compétitions. Peut-être pour la conception d'algorithmes complexes ? Cela donne aussi un peu peur pour l'avenir des métiers très spécialisés...

BenHernández
BenHernández 2025-11-02 02:30:39

AlphaGeometry2って前回のバージョンからかなり進化してるんですね。IMO金メダリストを超えるって凄すぎる😳 でもこれがどんどん研究が進んで、いずれ人間が解けない問題もAIが解く時代が来るのかな?ちょっと怖いかも

KevinBrown
KevinBrown 2025-09-03 20:30:33

Impressionnant mais un peu flippant... Si une IA peut battre des médaillés d'or aux Olympiades, qu'est-ce qui nous reste comme domaines où les humains sont encore les meilleurs ? 😅 J'espère qu'on va pas tous devenir obsolètes !

GregoryWalker
GregoryWalker 2025-08-21 01:01:20

This AI beating IMO champs is wild! 🧠 Geometry’s tough, but AlphaGeometry2’s out here crushing it. Makes me wonder if it’ll start tutoring kids soon! 😄

AnthonyMoore
AnthonyMoore 2025-08-20 03:01:23

Incroyable, AlphaGeometry2 dépasse les médaillés d'or de l'IMO en géométrie ! 😲 Ça montre à quel point l'IA avance vite, mais je me demande si elle pourrait un jour résoudre des problèmes plus... humains, comme gérer mes impôts !

OR