DeepMind的AI优于IMO金牌得主
谷歌DeepMind的最新AI,AlphaGeometry2,通过在国际数学奥林匹克(IMO)几何问题解决中超越平均金牌得主而引起轰动。这一于去年1月推出的AlphaGeometry升级版,据报道解决了过去25年IMO竞赛中84%的几何问题。
你可能好奇为什么DeepMind聚焦于高中数学竞赛。他们认为,破解这些具有挑战性的欧几里得几何问题可能是开发更高级AI的踏板。解决这些问题需要逻辑推理和探索多种解法路径的能力,这些技能对未来通用AI系统至关重要。
今年夏天,DeepMind展示了结合AlphaGeometry2与AlphaProof(另一款为形式数学推理设计的AI模型)的系统。它们共同解决了2024年IMO六道题目中的四道。这种方法可能扩展到数学和科学的其他领域,如复杂工程计算。
AlphaGeometry2由谷歌Gemini家族的语言模型和“符号引擎”驱动。Gemini模型协助符号引擎应用数学规则寻找解法,为几何定理创建可行证明。

IMO考试中的典型几何问题图。图片来源:谷歌(在新窗口打开) 在IMO中,几何问题常需在图中添加“构造”,如点、线或圆,然后解决。AlphaGeometry2的Gemini模型预测哪些构造可能有用,引导符号引擎进行推导。
工作原理如下:Gemini模型以形式数学语言建议步骤和构造,引擎检查其逻辑一致性。AlphaGeometry2使用搜索算法同时探索多条解法路径,并将潜在有用发现存储在共享知识库中。
当AlphaGeometry2结合Gemini模型的建议与符号引擎的已知原理形成完整证明时,问题被视为“解决”。
由于可用几何训练数据稀缺,DeepMind创建了合成数据,生成超过3亿个复杂度各异的定理和证明,训练AlphaGeometry2的语言模型。
DeepMind团队在2000至2024年IMO竞赛的45道几何问题(扩展为50道)上测试AlphaGeometry2,解决了42道,超过平均金牌得主分数40.9。
然而,AlphaGeometry2有局限性。它在涉及变点数、非线性方程和不等式的问题上表现不佳。虽然它不是首个达到金牌水平的几何AI,但它是首个在如此大问题集上做到这一点的AI。
面对29道尚未在竞赛中出现的IMO提名难题,AlphaGeometry2仅解决了20道。
研究结果可能引发关于构建AI系统最佳方法的进一步争论。我们应专注于符号操作(AI使用规则操作代表知识的符号),还是神经网络(模仿人脑结构并从数据学习)?
AlphaGeometry2采用混合方法,结合Gemini模型的神经网络架构与基于规则的符号引擎。
神经网络支持者认为智能行为可从海量数据和计算能力中涌现。相反,符号AI支持者认为它更适合编码知识、推理复杂场景和解释解法。
卡内基梅隆大学计算机科学教授Vince Conitzer评论了IMO基准测试的惊人进展与语言模型在简单常识问题上的持续挣扎之间的对比。他强调需要更好地理解这些系统及其风险。
AlphaGeometry2表明,结合符号操作和神经网络可能是追求可泛化AI的潜在方向。有趣的是,DeepMind团队发现AlphaGeometry2的语言模型无需符号引擎帮助即可生成部分解法,暗示语言模型未来可能实现自给自足。
然而,团队指出,在语言模型速度提升和幻觉问题解决之前,符号引擎等工具在数学应用中仍不可或缺。
相关文章
谷歌承诺遵循欧盟人工智能实践准则引发行业争论
谷歌承诺采纳欧盟自愿的人工智能实践准则,该框架旨在通过实施合规流程和系统,帮助人工智能开发者符合欧盟人工智能法案的要求。相比之下,Meta最近拒绝签署该准则,批评欧盟的人工智能法规过于严格,并警告欧洲的做法可能阻碍人工智能进步。谷歌的决定是在“具有系统性风险的通用人工智能模型”新规于8月2日生效前做出的。Anthropic、Google、Meta和OpenAI等主要参与者,以及其他大型生成模型,将
谷歌发布面向生产环境的Gemini 2.5 AI模型,挑战企业市场中的OpenAI
谷歌周一加码其AI战略,推出面向企业使用的先进Gemini 2.5模型,并引入成本效益更高的变体,以在价格和性能上展开竞争。这家隶属于Alphabet的公司将其旗舰AI模型——Gemini 2.5 Pro和Gemini 2.5 Flash——从测试阶段提升至全面可用,展示其在关键业务应用中的准备就绪。同时,谷歌推出了Gemini 2.5 Flash-Lite,定位为高容量任务中最具预算友好性的选择
Meta 增强人工智能安全,推出高级 Llama 工具
Meta 发布了新的 Llama 安全工具,以加强人工智能开发并防御新兴威胁。这些升级的 Llama 人工智能模型安全工具与 Meta 的新资源相结合,旨在增强网络安全团队利用人工智能进行防御的能力,提升所有人工智能利益相关者的安全性。使用 Llama 模型的开发者现在可以直接在 Meta 的 Llama Protections 页面、Hugging Face 和 GitHub 上访问增强的工具。
评论 (27)
0/200
AlbertSmith
2025-08-10 05:00:59
Wow, AlphaGeometry2 is killing it at IMO geometry problems! Beating gold medalists is wild—makes me wonder if AI will soon design math contests instead of just solving them. 😮
0
JackCarter
2025-07-28 10:13:31
This AI beating IMO champs is wild! 🤯 Makes me wonder if it could tutor me in math or just take over the world one proof at a time.
0
LarryMartin
2025-04-20 17:52:37
AlphaGeometry2는 정말 놀랍네요! IMO 기하 문제를 금메달리스트보다 더 잘 풀어요. 하지만 저는 수학 천재가 아니라서 마술 쇼를 보는 기분이에요. 좀 더 이해할 수 있으면 좋겠어요! 🤯
0
JerryGonzález
2025-04-17 07:58:03
DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて信じられない!まるでAIが人間より賢いSF映画を見ているよう。でも本当に、私の宿題を手伝ってくれるのかな?😂
0
RaymondBaker
2025-04-16 19:21:57
AlphaGeometry2 is mind-blowing! It's solving IMO geometry problems better than gold medalists. But I'm no math whiz, so it's more like watching a magic show for me. Wish I could understand it better! 🤯
0
JonathanAllen
2025-04-16 16:15:26
AlphaGeometry2 é impressionante! Resolve problemas de geometria do IMO melhor que medalhistas de ouro. Mas eu não sou um gênio em matemática, então pra mim é como assistir a um show de mágica. Queria entender melhor! 🤯
0
谷歌DeepMind的最新AI,AlphaGeometry2,通过在国际数学奥林匹克(IMO)几何问题解决中超越平均金牌得主而引起轰动。这一于去年1月推出的AlphaGeometry升级版,据报道解决了过去25年IMO竞赛中84%的几何问题。
你可能好奇为什么DeepMind聚焦于高中数学竞赛。他们认为,破解这些具有挑战性的欧几里得几何问题可能是开发更高级AI的踏板。解决这些问题需要逻辑推理和探索多种解法路径的能力,这些技能对未来通用AI系统至关重要。
今年夏天,DeepMind展示了结合AlphaGeometry2与AlphaProof(另一款为形式数学推理设计的AI模型)的系统。它们共同解决了2024年IMO六道题目中的四道。这种方法可能扩展到数学和科学的其他领域,如复杂工程计算。
AlphaGeometry2由谷歌Gemini家族的语言模型和“符号引擎”驱动。Gemini模型协助符号引擎应用数学规则寻找解法,为几何定理创建可行证明。
在IMO中,几何问题常需在图中添加“构造”,如点、线或圆,然后解决。AlphaGeometry2的Gemini模型预测哪些构造可能有用,引导符号引擎进行推导。
工作原理如下:Gemini模型以形式数学语言建议步骤和构造,引擎检查其逻辑一致性。AlphaGeometry2使用搜索算法同时探索多条解法路径,并将潜在有用发现存储在共享知识库中。
当AlphaGeometry2结合Gemini模型的建议与符号引擎的已知原理形成完整证明时,问题被视为“解决”。
由于可用几何训练数据稀缺,DeepMind创建了合成数据,生成超过3亿个复杂度各异的定理和证明,训练AlphaGeometry2的语言模型。
DeepMind团队在2000至2024年IMO竞赛的45道几何问题(扩展为50道)上测试AlphaGeometry2,解决了42道,超过平均金牌得主分数40.9。
然而,AlphaGeometry2有局限性。它在涉及变点数、非线性方程和不等式的问题上表现不佳。虽然它不是首个达到金牌水平的几何AI,但它是首个在如此大问题集上做到这一点的AI。
面对29道尚未在竞赛中出现的IMO提名难题,AlphaGeometry2仅解决了20道。
研究结果可能引发关于构建AI系统最佳方法的进一步争论。我们应专注于符号操作(AI使用规则操作代表知识的符号),还是神经网络(模仿人脑结构并从数据学习)?
AlphaGeometry2采用混合方法,结合Gemini模型的神经网络架构与基于规则的符号引擎。
神经网络支持者认为智能行为可从海量数据和计算能力中涌现。相反,符号AI支持者认为它更适合编码知识、推理复杂场景和解释解法。
卡内基梅隆大学计算机科学教授Vince Conitzer评论了IMO基准测试的惊人进展与语言模型在简单常识问题上的持续挣扎之间的对比。他强调需要更好地理解这些系统及其风险。
AlphaGeometry2表明,结合符号操作和神经网络可能是追求可泛化AI的潜在方向。有趣的是,DeepMind团队发现AlphaGeometry2的语言模型无需符号引擎帮助即可生成部分解法,暗示语言模型未来可能实现自给自足。
然而,团队指出,在语言模型速度提升和幻觉问题解决之前,符号引擎等工具在数学应用中仍不可或缺。



Wow, AlphaGeometry2 is killing it at IMO geometry problems! Beating gold medalists is wild—makes me wonder if AI will soon design math contests instead of just solving them. 😮




This AI beating IMO champs is wild! 🤯 Makes me wonder if it could tutor me in math or just take over the world one proof at a time.




AlphaGeometry2는 정말 놀랍네요! IMO 기하 문제를 금메달리스트보다 더 잘 풀어요. 하지만 저는 수학 천재가 아니라서 마술 쇼를 보는 기분이에요. 좀 더 이해할 수 있으면 좋겠어요! 🤯




DeepMindのAlphaGeometry2がIMOの金メダリストを上回るなんて信じられない!まるでAIが人間より賢いSF映画を見ているよう。でも本当に、私の宿題を手伝ってくれるのかな?😂




AlphaGeometry2 is mind-blowing! It's solving IMO geometry problems better than gold medalists. But I'm no math whiz, so it's more like watching a magic show for me. Wish I could understand it better! 🤯




AlphaGeometry2 é impressionante! Resolve problemas de geometria do IMO melhor que medalhistas de ouro. Mas eu não sou um gênio em matemática, então pra mim é como assistir a um show de mágica. Queria entender melhor! 🤯












