选项
首页
新闻
DeepMind的AI在2025年数学奥林匹克获得金牌

DeepMind的AI在2025年数学奥林匹克获得金牌

2025-08-22
0

DeepMind的AI在数学推理方面取得惊人飞跃,在2025年国际数学奥林匹克(IMO)中获得金牌,仅在2024年获得银牌一年后。这一突破凸显了AI在解决需要类人创意的复杂抽象问题方面的日益强大。本文探讨了DeepMind的转型之旅、关键技术进步及其里程碑的广泛影响。

为何IMO重要

自1959年以来,国际数学奥林匹克一直是全球顶尖的高中生数学竞赛。它以代数、几何、数论和组合数学的六个复杂问题挑战参赛者,要求卓越的创意、逻辑和优雅的证明。

对AI而言,IMO是一项艰巨的考验。与模式识别或围棋等策略游戏不同,奥林匹克数学需要抽象推理和创新理念综合——长期被认为独属于人类的技能。因此,IMO成为衡量AI向类人智能进步的基准。

2024年的银牌里程碑

2024年,DeepMind首次推出两款针对IMO问题的AI系统:AlphaProof和AlphaGeometry 2,二者均采用“神经-符号”AI,结合大型语言模型(LLMs)与符号逻辑。

AlphaProof使用形式化数学语言Lean证明命题。它整合了DeepMind的大型语言模型Gemini和以掌握棋盘游戏而闻名的强化学习系统AlphaZero。Gemini将问题翻译成Lean,生成逻辑步骤,而AlphaProof通过在数百万多样化数学问题上的训练,通过自我改进提升技能。

AlphaGeometry 2在几何学方面表现出色,Gemini预测辅助构造,符号引擎处理推导。这种混合方法使其能够解决复杂的几何问题。

这些系统解决了六道IMO问题中的四道——两道代数、一道数论、一道几何——得分28/42,获得银牌。这标志着AI的历史性成就,尽管依赖人工翻译和大量计算资源。

获得金牌的关键创新

DeepMind在2025年跃升至金牌源于重大技术进步。

1. 自然语言证明

关键转变是使用自然语言进行证明,消除了将问题翻译成形式语言的专家需求。升级后的Gemini具备Deep Think功能,直接处理问题,勾勒非正式证明,内部形式化关键步骤,并提供清晰的中文证明。通过人类反馈的强化学习(RLHF)确保了简洁、逻辑的解决方案。

Gemini Deep Think以更长的上下文窗口和更多计算令牌脱颖而出,支持多页推理。它采用并行推理,生成数百条解决方案路径,由监督者排名最佳,类似人类头脑风暴。

2. 高级训练技术

Gemini Deep Think在数学论坛、arXiv和大学问题集的10万解决方案语料库上进行微调,由人类导师过滤错误。通过对验证子引理的逐步奖励强化学习,引导模型生成简洁证明。训练历时三个月,使用2500万TPU小时。

3. 并行处理能力

并行化至关重要,同时探索多个推理分支。资源动态分配到有前景的路径,尤其对组合数学有效。这种方法由DeepMind的TPU v5集群支持,类似人类在完整证明前测试不等式的策略。

DeepMind的2025年IMO胜利

为确保公平,DeepMind在IMO前三周冻结模型权重,过滤未发布的问题解决方案。比赛期间,Gemini Deep Think在无网络访问的情况下处理六道纯文本问题,使用相当于笔记本电脑的计算能力。它在三小时内完成证明,五道问题获得满分,总分35/42——获得金牌。AI的证明被赞为严谨彻底,达到人类标准。

对AI和数学的影响

DeepMind的成功表明AI向通用人工智能(AGI)的进步,因为IMO问题需要高级推理。对数学而言,Gemini Deep Think等AI工具可协助探索新定理、验证猜想和简化证明,解放数学家从事概念性工作。然而,AI在教育和竞赛中的角色引发了关于未来结构的问题。

未来展望

尽管一些数学挑战仍存,DeepMind的快速发展表明AI可能很快能解决重大未解问题。2025年IMO的胜利凸显了AI在逻辑推理方面的进步,引发了关于其将补充还是重新定义数学中人类创意的讨论。

相关文章
AI驱动的视差制作工具:打造动态2.5D动画 AI驱动的视差制作工具:打造动态2.5D动画 使用视差制作工具将静态图像转化为引人入胜的2.5D动画。この开源工具赋予艺术家和游戏开发者为作品注入深度和动态的能力。借助Stability AI API,视差制作工具确保即使在普通硬件上也能实现流畅的工作流程。探索此工具的功能及其如何提升您的创意项目。主要亮点视差制作工具是一个用于制作2.5D动画的开源解决方案。它将图像转化为与Blender和Unreal Engine兼容的动画。与Stabil
Trunk Tools获4000万美元推动AI驱动的建筑解决方案 Trunk Tools获4000万美元推动AI驱动的建筑解决方案 Trunk Tools,一家变革建筑专业人士管理和使用项目数据的AI创新公司,在B轮融资中筹集了4000万美元。由Insight Partners领投,Redpoint Ventures、Innovation Endeavors、Stepstone、Liberty Mutual Strategic Ventures和Prudence参与,总资本增至7000万美元。全球建筑行业价值近10万亿美元且持
AI驱动的房地产广告:通过Likely AI提升潜在客户质量 AI驱动的房地产广告:通过Likely AI提升潜在客户质量 在当今快节奏的房地产市场中,差异化是关键。Likely AI的广告创建工具通过使用人工智能打造高度针对性、影响深远的广告活动,改变营销方式。这一创新工具简化了广告创建流程,使房地产专业人士能够与理想受众建立联系,并以惊人的效率生成高质量潜在客户。借助Likely AI,重点从数量转向价值,确保您的信息在最佳时机传递给正确的受众。主要亮点Likely AI的广告创建工具利用AI生成定制的房地产广告。
评论 (0)
0/200
返回顶部
OR