AI学者在Alphago的国际象棋胜利背后获得了Turing奖的技术

首页

新闻

2025-04-18

KeithSmith

200

AI学者在Alphago的国际象棋胜利背后获得了Turing奖的技术

在过去十年中，人工智能以其进步令人眼花缭乱，特别是在一种技术中，计算机通过随机选择并从结果中学习。这种方法，被称为强化学习，在实现人工智能的卓越成就中发挥了关键作用。

以谷歌DeepMind的AlphaZero程序为例，该程序在2016年启动，到2018年已掌握了国际象棋、将棋和围棋等复杂游戏。同样，AlphaStar使用这种方法在视频游戏《星际争霸II》中达到了“大师”级别。这些成就凸显了强化学习的强大力量。

周三，该领域庆祝了一个重要的里程碑，两位人工智能学者因其在推进强化学习方面的开创性工作而受到表彰。马萨诸塞大学阿默斯特分校名誉教授安德鲁·G·巴托和加拿大阿尔伯塔大学教授理查德·S·萨顿获得了计算机协会（ACM）颁发的2025年图灵奖。

强化学习先驱的认可

ACM赞扬巴托和萨顿为强化学习奠定了基础，称他们“提出了主要思想，构建了数学基础，并开发了重要算法”。这一殊荣伴随着100万美元的奖金，常被视为计算机行业的诺贝尔奖等价物。

强化学习可以比作老鼠在迷宫中寻找奶酪。老鼠学会哪些路径通向进步，哪些是死胡同。同样，神经科学家认为，智能生物，如老鼠，会发展出一种“内部世界模型”来指导其行动。

萨顿和巴托提出，计算机也可以发展这样的内部模型。在强化学习中，计算机收集关于其环境的数据——无论是迷宫还是棋盘——并最初随机行动。它以奖励或惩罚的形式接收反馈，这有助于它估计不同行动的结果。基于这些估计，程序会制定一个“策略”来指导未来的决策，平衡探索新行动与利用已知成功行动的关系。

探索与利用的角色

强化学习的核心在于探索新可能性与利用已知策略之间的微妙平衡。单一方法不足以成功。

对于希望深入研究的读者，萨顿和巴托2018年的教科书是宝贵的资源。

值得注意的是，“强化学习”一词有时被OpenAI等公司以不同方式使用，他们采用“基于人类反馈的强化学习”（RLHF）来优化大型语言模型如GPT的输出。然而，这与萨顿和巴托开发的方法有所不同。

强化学习作为一种思维理论

萨顿在2017年至2023年间担任DeepMind杰出研究科学家，他认为强化学习不仅仅是一种技术，而是一种“思维理论”。他表达了对人工智能缺乏计算理论的担忧，坚称“强化学习是智能的第一个计算理论”。

除了技术应用，强化学习还可能揭示创造力和自由玩耍作为智能表达的作用。萨顿和巴托强调了玩耍在学习中的作用，指出好奇心驱动探索。萨顿强调，玩耍可能涉及设定一些暂时无用的目标，但这些目标可能在未来证明有益。

“玩耍是一件大事，”萨顿评论道，指出其在学习和智能更广泛背景中的重要角色。

强化学习的旅程，从巴托和萨顿的奠基工作到其在游戏及更广泛领域的应用，继续推动人工智能所能实现的边界。

Google 相册借助人工智能，将《绯闻女孩》中那间标志性的衣帽间重现于世谷歌相册于周三宣布推出一项基于人工智能的新功能，该功能将很快把你的服装照片转化为一个数字衣橱，让你能够搭配出全新的穿搭组合，甚至可以进行虚拟试穿。这一概念显然借鉴了电影《绯闻女孩》中雪儿（Cher）那标志性的虚拟衣橱，她在其中可以浏览众多套装，从而决定穿什么。谷歌表示，该功能将利用人工智能技术，根据用户Google相册中的衣物自动构建一个数字衣橱。在应用内，用户可以按类别（如上装、下装、首饰等）筛

短剧《红果》被指利用AI盗用普通人面孔；尚未有官方回应短视频行业目前正面临一场涉及AI侵权的争议。红果短剧出品的《桃发簪》被指控利用AI“盗用面孔”——未经许可盗用普通人的肖像——引发公众关注。此事起因于一名社交媒体用户指控其个人照片未经授权被用于AI生成的内容中。对比数据显示，该剧角色的服装、妆容、配饰及体貌特征与受害者照片中的形象高度吻合。加之剧中角色形象负面，关于肖像权和名誉权的争议愈演愈烈。这并非孤立事件。随着生成式AI降低了微短剧制作的成

解读新的ETSI人工智能安全标准 ETSI EN 304 223 确立了人工智能的基础安全要求，各组织应将其纳入其治理架构中。随着企业将机器学习融入核心工作流程，该欧洲标准为保护人工智能模型和系统提供了具体规定。这是首个适用于全球的人工智能网络安全欧洲标准，已获得各国国家标准化机构的正式批准，从而增强了其在国际市场上的公信力。作为《欧盟人工智能法案》的补充基准，该标准承认人工智能系统存在独特风险——包括数据中毒、模型混淆和间接提示

相关专题推荐

生产率

AI 架构设计师：利用自然语言构建可扩展的系统架构

在 XIX.AI 上探索 2026 年最佳 AI 架构设计工具。我们精心筛选并广受好评的这份清单，汇集了功能强大且具有颠覆性的解决方案，助您通过自然语言构建可扩展的系统架构。结合实际应用案例，对比免费与付费选项。立即释放您的 AI 优势，优化开发流程。

10 个工具

xix.ai

漫画创作

AI角色创建工具：为漫画主角生成详细的背景故事及视觉参考资料

2026年最新最佳AI角色创建工具：发现那些备受好评的工具，它们能够帮助你为漫画角色生成详细的背景故事和视觉素材。我们精心整理的这份每周更新的列表会根据实际测试结果，对比免费与付费选项的优劣。找到这些强大且能改变创作流程的工具，帮助你塑造引人入胜的角色，提升创作效率。立即访问XIX.AI查看排名，找到最适合你的故事创作助手吧。

10 个工具

xix.ai

健康养生

AI孕期伴侣：生成安全可靠的各孕期运动与营养计划

探索2026年最佳AI孕期伴侣，获取安全、个性化的各孕期运动与营养计划。获取经过精心筛选的高评分推荐，包含免费与付费版本的对比分析及真实用户反馈。借助XIX.AI的专家指南，开启您最健康的孕期之旅。立即探索。

10 个工具

xix.ai

写作

最佳免费且无法被识别的AI写作工具：将生硬的草稿转化为自然流畅、宛如人类撰写的文字

在 XIX.AI 探索 2026 年最佳免费且难以被察觉的 AI 写作工具。我们精心筛选的顶级推荐清单，助您将生硬的草稿转化为自然流畅、宛如人类撰写的文字。通过实际测试和每周更新的排行榜，对比免费与付费选项。立即解锁您的 AI 写作优势。

10 个工具

xix.ai

图像编辑

用于短剧故事板的AI艺术生成工具：幻想与都市浪漫题材的角色设计

2026最新推荐：探索最适合用于短剧故事板制作的AI艺术生成工具。我们精心挑选了众多顶级工具，帮助您创作出引人入胜的幻想角色和都市浪漫角色。您可以对比免费与付费选项，查看实际测试结果，从而找到最适合自己的创意工具。XIX.AI还会每周更新排名并提供专家分析，让您立即开始将故事可视化呈现吧！

10 个工具

xix.ai

写作

最适合广播和播客使用的AI脚本编写工具：帮助您创作引人入胜的音频广告

在XIX.AI上，发现2026年最适合用于广播和播客制作的AI脚本工具。我们精心挑选的这些高评分工具能够提供强大的功能，帮助您快速制作出引人入胜的音频广告。通过实际测试和每周更新的排名，您可以了解免费选项与付费选项之间的差异。今天就释放您的创造力吧！

10 个工具

xix.ai

0/500

请登录后再操作

NicholasAdams

2025-08-16 19:00:59

This reinforcement learning stuff is wild! AlphaGo beating chess champs? Mind blown 🤯. Makes me wonder how far AI can push human limits—scary but exciting!

GeorgeTaylor

2025-08-11 03:00:59

Mind-blowing how reinforcement learning led to AlphaGo's chess win! 🤯 Makes me wonder what other games AI will conquer next.

ArthurBrown

2025-04-22 06:39:03

The AI Scholars Awarded Turing Prize really blew my mind! The way they used reinforcement learning to make AlphaGo win at chess is just genius. It's like watching a sci-fi movie come to life. I wish I understood the tech better, but it's still super cool! 🤓

EdwardTaylor

2025-04-21 12:00:52

AlphaGoのチェス勝利の背後にある技術でAI Scholarsがチューリング賞を受賞したのは驚きです！強化学習がAIをこれほどの高みに押し上げたのを見るのは魅力的です。ただ、時々技術的な内容が難しすぎることがありますが、それでも人間の創意工夫の証です。境界を押し広げ続けてください！🧠

WalterSanchez

2025-04-21 09:09:05

The AI Scholars winning the Turing Prize for the technique behind AlphaGo's chess victory is mind-blowing! It's fascinating to see how reinforcement learning has propelled AI to such heights. The only thing is, it's a bit too technical for me at times, but still, it's a testament to human ingenuity. Keep pushing the boundaries! 🧠

WillieJackson

2025-04-20 17:42:21

¡Los académicos de IA que recibieron el Premio Turing por la técnica detrás de la victoria de AlphaGo en el ajedrez me dejaron asombrado! Usar el aprendizaje por refuerzo para ganar es genial. Me gustaría entender mejor la tecnología, pero aún así es muy cool! 🤓

头条新闻

AI Builder和Power Automate革新文档摘要 AI寄主Notebooklm播客现已上中国发布人形机器人及具身智能国家标准 Ramp 数据显示企业人工智能应用趋于平稳 Bing图像创建者教程：AI艺术生成指南学习使用您的声音创建AI音乐：逐步Suno教程 iMyFone MagicMic：实时AI变声器评测与教程 2025顶级AI视频生成器：Pika Labs与其他对比 Embodied Intelligence 发布首个行业标准，旨在遏制无序增长 DeepSeek V4 作为多模态人工智能变革者横空出世

精选