DeepMind的AI优于IMO金牌得主
谷歌DeepMind的最新AI,AlphaGeometry2,通过在国际数学奥林匹克(IMO)几何问题解决中超越平均金牌得主而引起轰动。这一于去年1月推出的AlphaGeometry升级版,据报道解决了过去25年IMO竞赛中84%的几何问题。
你可能好奇为什么DeepMind聚焦于高中数学竞赛。他们认为,破解这些具有挑战性的欧几里得几何问题可能是开发更高级AI的踏板。解决这些问题需要逻辑推理和探索多种解法路径的能力,这些技能对未来通用AI系统至关重要。
今年夏天,DeepMind展示了结合AlphaGeometry2与AlphaProof(另一款为形式数学推理设计的AI模型)的系统。它们共同解决了2024年IMO六道题目中的四道。这种方法可能扩展到数学和科学的其他领域,如复杂工程计算。
AlphaGeometry2由谷歌Gemini家族的语言模型和“符号引擎”驱动。Gemini模型协助符号引擎应用数学规则寻找解法,为几何定理创建可行证明。

IMO考试中的典型几何问题图。图片来源:谷歌(在新窗口打开) 在IMO中,几何问题常需在图中添加“构造”,如点、线或圆,然后解决。AlphaGeometry2的Gemini模型预测哪些构造可能有用,引导符号引擎进行推导。
工作原理如下:Gemini模型以形式数学语言建议步骤和构造,引擎检查其逻辑一致性。AlphaGeometry2使用搜索算法同时探索多条解法路径,并将潜在有用发现存储在共享知识库中。
当AlphaGeometry2结合Gemini模型的建议与符号引擎的已知原理形成完整证明时,问题被视为“解决”。
由于可用几何训练数据稀缺,DeepMind创建了合成数据,生成超过3亿个复杂度各异的定理和证明,训练AlphaGeometry2的语言模型。
DeepMind团队在2000至2024年IMO竞赛的45道几何问题(扩展为50道)上测试AlphaGeometry2,解决了42道,超过平均金牌得主分数40.9。
然而,AlphaGeometry2有局限性。它在涉及变点数、非线性方程和不等式的问题上表现不佳。虽然它不是首个达到金牌水平的几何AI,但它是首个在如此大问题集上做到这一点的AI。
面对29道尚未在竞赛中出现的IMO提名难题,AlphaGeometry2仅解决了20道。
研究结果可能引发关于构建AI系统最佳方法的进一步争论。我们应专注于符号操作(AI使用规则操作代表知识的符号),还是神经网络(模仿人脑结构并从数据学习)?
AlphaGeometry2采用混合方法,结合Gemini模型的神经网络架构与基于规则的符号引擎。
神经网络支持者认为智能行为可从海量数据和计算能力中涌现。相反,符号AI支持者认为它更适合编码知识、推理复杂场景和解释解法。
卡内基梅隆大学计算机科学教授Vince Conitzer评论了IMO基准测试的惊人进展与语言模型在简单常识问题上的持续挣扎之间的对比。他强调需要更好地理解这些系统及其风险。
AlphaGeometry2表明,结合符号操作和神经网络可能是追求可泛化AI的潜在方向。有趣的是,DeepMind团队发现AlphaGeometry2的语言模型无需符号引擎帮助即可生成部分解法,暗示语言模型未来可能实现自给自足。
然而,团队指出,在语言模型速度提升和幻觉问题解决之前,符号引擎等工具在数学应用中仍不可或缺。
相关文章
WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能
广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
Kakao Mobility 概述了面向物理人工智能的 L4 级自动驾驶路线图
Kakao Mobility 计划内部自主研发 L4 级自动驾驶技术,作为其物理人工智能战略的一部分。在首尔COEX举行的2026世界IT展上,Kakao Mobility副总裁兼物理AI部门负责人金镇奎(Kim Jin-kyu)介绍了该路线图。他的演讲聚焦于物理AI时代基于出行平台构建的自动驾驶服务。据韩联社报道,这场题为“超越构想,付诸行动:AI驱动现实”的活动汇聚了来自17个国家的460
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
相关专题推荐
评论 (34)
0/500
C'est impressionnant de voir à quelle vitesse AlphaGeometry2 a été développé après la première version ! 😮 Mais je me demande comment cela se traduirait dans le monde réel, au-delà des compétitions. Peut-être pour la conception d'algorithmes complexes ? Cela donne aussi un peu peur pour l'avenir des métiers très spécialisés...
AlphaGeometry2って前回のバージョンからかなり進化してるんですね。IMO金メダリストを超えるって凄すぎる😳 でもこれがどんどん研究が進んで、いずれ人間が解けない問題もAIが解く時代が来るのかな?ちょっと怖いかも
Impressionnant mais un peu flippant... Si une IA peut battre des médaillés d'or aux Olympiades, qu'est-ce qui nous reste comme domaines où les humains sont encore les meilleurs ? 😅 J'espère qu'on va pas tous devenir obsolètes !
This AI beating IMO champs is wild! 🧠 Geometry’s tough, but AlphaGeometry2’s out here crushing it. Makes me wonder if it’ll start tutoring kids soon! 😄
谷歌DeepMind的最新AI,AlphaGeometry2,通过在国际数学奥林匹克(IMO)几何问题解决中超越平均金牌得主而引起轰动。这一于去年1月推出的AlphaGeometry升级版,据报道解决了过去25年IMO竞赛中84%的几何问题。
你可能好奇为什么DeepMind聚焦于高中数学竞赛。他们认为,破解这些具有挑战性的欧几里得几何问题可能是开发更高级AI的踏板。解决这些问题需要逻辑推理和探索多种解法路径的能力,这些技能对未来通用AI系统至关重要。
今年夏天,DeepMind展示了结合AlphaGeometry2与AlphaProof(另一款为形式数学推理设计的AI模型)的系统。它们共同解决了2024年IMO六道题目中的四道。这种方法可能扩展到数学和科学的其他领域,如复杂工程计算。
AlphaGeometry2由谷歌Gemini家族的语言模型和“符号引擎”驱动。Gemini模型协助符号引擎应用数学规则寻找解法,为几何定理创建可行证明。

在IMO中,几何问题常需在图中添加“构造”,如点、线或圆,然后解决。AlphaGeometry2的Gemini模型预测哪些构造可能有用,引导符号引擎进行推导。
工作原理如下:Gemini模型以形式数学语言建议步骤和构造,引擎检查其逻辑一致性。AlphaGeometry2使用搜索算法同时探索多条解法路径,并将潜在有用发现存储在共享知识库中。
当AlphaGeometry2结合Gemini模型的建议与符号引擎的已知原理形成完整证明时,问题被视为“解决”。
由于可用几何训练数据稀缺,DeepMind创建了合成数据,生成超过3亿个复杂度各异的定理和证明,训练AlphaGeometry2的语言模型。
DeepMind团队在2000至2024年IMO竞赛的45道几何问题(扩展为50道)上测试AlphaGeometry2,解决了42道,超过平均金牌得主分数40.9。
然而,AlphaGeometry2有局限性。它在涉及变点数、非线性方程和不等式的问题上表现不佳。虽然它不是首个达到金牌水平的几何AI,但它是首个在如此大问题集上做到这一点的AI。
面对29道尚未在竞赛中出现的IMO提名难题,AlphaGeometry2仅解决了20道。
研究结果可能引发关于构建AI系统最佳方法的进一步争论。我们应专注于符号操作(AI使用规则操作代表知识的符号),还是神经网络(模仿人脑结构并从数据学习)?
AlphaGeometry2采用混合方法,结合Gemini模型的神经网络架构与基于规则的符号引擎。
神经网络支持者认为智能行为可从海量数据和计算能力中涌现。相反,符号AI支持者认为它更适合编码知识、推理复杂场景和解释解法。
卡内基梅隆大学计算机科学教授Vince Conitzer评论了IMO基准测试的惊人进展与语言模型在简单常识问题上的持续挣扎之间的对比。他强调需要更好地理解这些系统及其风险。
AlphaGeometry2表明,结合符号操作和神经网络可能是追求可泛化AI的潜在方向。有趣的是,DeepMind团队发现AlphaGeometry2的语言模型无需符号引擎帮助即可生成部分解法,暗示语言模型未来可能实现自给自足。
然而,团队指出,在语言模型速度提升和幻觉问题解决之前,符号引擎等工具在数学应用中仍不可或缺。
WordPress.com 现已支持 AI 助手撰写和发布文章,还有更多功能
广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布,将允许人工智能助手在用户网站上起草、编辑和发布内容,同时还能管理评论、更新和修正元数据,并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制,网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能,网站几乎可以完全由人工指导的AI代理来创建和运
谷歌在印度的Chrome浏览器中推出Gemini
周三,谷歌宣布将把Chrome浏览器中Gemini的集成功能扩展至印度、加拿大和新西兰等新地区。此次更新使桌面端用户能够通过侧边栏访问Gemini,用户可通过该功能向谷歌的AI聊天机器人咨询屏幕上的内容,从Gmail、Keep、Drive和YouTube中检索信息,并比较不同标签页的内容。随着此次扩展,除了英语和近期新增的Chrome支持语言外,Gemini还将支持印地语、孟加拉语、古吉拉特语、卡
C'est impressionnant de voir à quelle vitesse AlphaGeometry2 a été développé après la première version ! 😮 Mais je me demande comment cela se traduirait dans le monde réel, au-delà des compétitions. Peut-être pour la conception d'algorithmes complexes ? Cela donne aussi un peu peur pour l'avenir des métiers très spécialisés...
AlphaGeometry2って前回のバージョンからかなり進化してるんですね。IMO金メダリストを超えるって凄すぎる😳 でもこれがどんどん研究が進んで、いずれ人間が解けない問題もAIが解く時代が来るのかな?ちょっと怖いかも
Impressionnant mais un peu flippant... Si une IA peut battre des médaillés d'or aux Olympiades, qu'est-ce qui nous reste comme domaines où les humains sont encore les meilleurs ? 😅 J'espère qu'on va pas tous devenir obsolètes !
This AI beating IMO champs is wild! 🧠 Geometry’s tough, but AlphaGeometry2’s out here crushing it. Makes me wonder if it’ll start tutoring kids soon! 😄





首页






