选项
首页
新闻
AI学者在Alphago的国际象棋胜利背后获得了Turing奖的技术

AI学者在Alphago的国际象棋胜利背后获得了Turing奖的技术

2025-04-18
200

AI学者在Alphago的国际象棋胜利背后获得了Turing奖的技术

在过去十年中,人工智能以其进步令人眼花缭乱,特别是在一种技术中,计算机通过随机选择并从结果中学习。这种方法,被称为强化学习,在实现人工智能的卓越成就中发挥了关键作用。

以谷歌DeepMind的AlphaZero程序为例,该程序在2016年启动,到2018年已掌握了国际象棋、将棋和围棋等复杂游戏。同样,AlphaStar使用这种方法在视频游戏《星际争霸II》中达到了“大师”级别。这些成就凸显了强化学习的强大力量。

周三,该领域庆祝了一个重要的里程碑,两位人工智能学者因其在推进强化学习方面的开创性工作而受到表彰。马萨诸塞大学阿默斯特分校名誉教授安德鲁·G·巴托和加拿大阿尔伯塔大学教授理查德·S·萨顿获得了计算机协会(ACM)颁发的2025年图灵奖。

强化学习先驱的认可

ACM赞扬巴托和萨顿为强化学习奠定了基础,称他们“提出了主要思想,构建了数学基础,并开发了重要算法”。这一殊荣伴随着100万美元的奖金,常被视为计算机行业的诺贝尔奖等价物。

强化学习可以比作老鼠在迷宫中寻找奶酪。老鼠学会哪些路径通向进步,哪些是死胡同。同样,神经科学家认为,智能生物,如老鼠,会发展出一种“内部世界模型”来指导其行动。

萨顿和巴托提出,计算机也可以发展这样的内部模型。在强化学习中,计算机收集关于其环境的数据——无论是迷宫还是棋盘——并最初随机行动。它以奖励或惩罚的形式接收反馈,这有助于它估计不同行动的结果。基于这些估计,程序会制定一个“策略”来指导未来的决策,平衡探索新行动与利用已知成功行动的关系。

探索与利用的角色

强化学习的核心在于探索新可能性与利用已知策略之间的微妙平衡。单一方法不足以成功。

对于希望深入研究的读者,萨顿和巴托2018年的教科书是宝贵的资源。

值得注意的是,“强化学习”一词有时被OpenAI等公司以不同方式使用,他们采用“基于人类反馈的强化学习”(RLHF)来优化大型语言模型如GPT的输出。然而,这与萨顿和巴托开发的方法有所不同。

强化学习作为一种思维理论

萨顿在2017年至2023年间担任DeepMind杰出研究科学家,他认为强化学习不仅仅是一种技术,而是一种“思维理论”。他表达了对人工智能缺乏计算理论的担忧,坚称“强化学习是智能的第一个计算理论”。

除了技术应用,强化学习还可能揭示创造力和自由玩耍作为智能表达的作用。萨顿和巴托强调了玩耍在学习中的作用,指出好奇心驱动探索。萨顿强调,玩耍可能涉及设定一些暂时无用的目标,但这些目标可能在未来证明有益。

“玩耍是一件大事,”萨顿评论道,指出其在学习和智能更广泛背景中的重要角色。

强化学习的旅程,从巴托和萨顿的奠基工作到其在游戏及更广泛领域的应用,继续推动人工智能所能实现的边界。

相关文章
解读新的ETSI人工智能安全标准 解读新的ETSI人工智能安全标准 ETSI EN 304 223 确立了人工智能的基础安全要求,各组织应将其纳入其治理架构中。随着企业将机器学习融入核心工作流程,该欧洲标准为保护人工智能模型和系统提供了具体规定。这是首个适用于全球的人工智能网络安全欧洲标准,已获得各国国家标准化机构的正式批准,从而增强了其在国际市场上的公信力。作为《欧盟人工智能法案》的补充基准,该标准承认人工智能系统存在独特风险——包括数据中毒、模型混淆和间接提示
Gmail 推出个性化 AI 收件箱、搜索中的 AI 概览等功能 Gmail 推出个性化 AI 收件箱、搜索中的 AI 概览等功能 谷歌为Gmail推出了一款全新的AI智能收件箱,它能为您提供个性化的任务概览,并让您及时掌握重要更新。此外,Gmail还在搜索功能中推出了AI概览,并新增了一款类似Grammarly的校对工具。此前仅限付费用户使用的多项AI功能,现已向所有用户开放。新的“AI收件箱”标签页包含两个部分:“建议待办事项”和“待跟进主题”。 第一个部分显示需要采取行动的高优先级邮件摘要——例如,关于明天到期的账单提醒
首家百度AI影视剧创作基地在山东淄博正式启动 首家百度AI影视剧创作基地在山东淄博正式启动 4月27日,山东省在数字文化创作领域迈出了重要一步,其首个百度AI漫画剧创作基地在淄博师范学院正式揭牌。该基地标志着校企合作开启了新篇章,旨在通过人工智能技术与文化创作教育的深度融合,探索培养数字文化创作人才的创新模式。在揭牌仪式上,校方代表强调,该基地将成为创新人才培养及深化政校企合作的重要平台。 展望未来,该校计划将真实项目案例引入课堂,摒弃传统教学方法,构建一个完整的项目化教学闭环,将“作业
相关专题推荐
漫画创作 AI角色创建工具:为漫画主角生成详细的背景故事及视觉参考资料
AI角色创建工具:为漫画主角生成详细的背景故事及视觉参考资料

2026年最新最佳AI角色创建工具:发现那些备受好评的工具,它们能够帮助你为漫画角色生成详细的背景故事和视觉素材。我们精心整理的这份每周更新的列表会根据实际测试结果,对比免费与付费选项的优劣。找到这些强大且能改变创作流程的工具,帮助你塑造引人入胜的角色,提升创作效率。立即访问XIX.AI查看排名,找到最适合你的故事创作助手吧。

10 个工具
xix.ai
健康养生 AI孕期伴侣:生成安全可靠的各孕期运动与营养计划
AI孕期伴侣:生成安全可靠的各孕期运动与营养计划

探索2026年最佳AI孕期伴侣,获取安全、个性化的各孕期运动与营养计划。获取经过精心筛选的高评分推荐,包含免费与付费版本的对比分析及真实用户反馈。借助XIX.AI的专家指南,开启您最健康的孕期之旅。立即探索。

10 个工具
xix.ai
写作 最佳免费且无法被识别的AI写作工具:将生硬的草稿转化为自然流畅、宛如人类撰写的文字
最佳免费且无法被识别的AI写作工具:将生硬的草稿转化为自然流畅、宛如人类撰写的文字

在 XIX.AI 探索 2026 年最佳免费且难以被察觉的 AI 写作工具。我们精心筛选的顶级推荐清单,助您将生硬的草稿转化为自然流畅、宛如人类撰写的文字。通过实际测试和每周更新的排行榜,对比免费与付费选项。立即解锁您的 AI 写作优势。

10 个工具
xix.ai
图像编辑 用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计
用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计

2026最新推荐:探索最适合用于短剧故事板制作的AI艺术生成工具。我们精心挑选了众多顶级工具,帮助您创作出引人入胜的幻想角色和都市浪漫角色。您可以对比免费与付费选项,查看实际测试结果,从而找到最适合自己的创意工具。XIX.AI还会每周更新排名并提供专家分析,让您立即开始将故事可视化呈现吧!

10 个工具
xix.ai
写作 最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告
最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告

在XIX.AI上,发现2026年最适合用于广播和播客制作的AI脚本工具。我们精心挑选的这些高评分工具能够提供强大的功能,帮助您快速制作出引人入胜的音频广告。通过实际测试和每周更新的排名,您可以了解免费选项与付费选项之间的差异。今天就释放您的创造力吧!

10 个工具
xix.ai
商业 最佳 AI 合同审查软件:即时发现法律漏洞与合规风险
最佳 AI 合同审查软件:即时发现法律漏洞与合规风险

在 XIX.AI 上探索 2026 年最佳 AI 合同审查软件。我们精心筛选的顶级榜单汇集了功能强大的工具,能够即时发现法律漏洞和合规风险。通过实际测试和每周更新的排名,对比免费与付费选项。找到能彻底改变游戏规则的解决方案,实现安全、高效的合同分析。立即探索这本权威指南。

10 个工具
xix.ai
评论 (12)
0/500
NicholasAdams
NicholasAdams 2025-08-16 19:00:59

This reinforcement learning stuff is wild! AlphaGo beating chess champs? Mind blown 🤯. Makes me wonder how far AI can push human limits—scary but exciting!

GeorgeTaylor
GeorgeTaylor 2025-08-11 03:00:59

Mind-blowing how reinforcement learning led to AlphaGo's chess win! 🤯 Makes me wonder what other games AI will conquer next.

ArthurBrown
ArthurBrown 2025-04-22 06:39:03

The AI Scholars Awarded Turing Prize really blew my mind! The way they used reinforcement learning to make AlphaGo win at chess is just genius. It's like watching a sci-fi movie come to life. I wish I understood the tech better, but it's still super cool! 🤓

EdwardTaylor
EdwardTaylor 2025-04-21 12:00:52

AlphaGoのチェス勝利の背後にある技術でAI Scholarsがチューリング賞を受賞したのは驚きです!強化学習がAIをこれほどの高みに押し上げたのを見るのは魅力的です。ただ、時々技術的な内容が難しすぎることがありますが、それでも人間の創意工夫の証です。境界を押し広げ続けてください!🧠

WalterSanchez
WalterSanchez 2025-04-21 09:09:05

The AI Scholars winning the Turing Prize for the technique behind AlphaGo's chess victory is mind-blowing! It's fascinating to see how reinforcement learning has propelled AI to such heights. The only thing is, it's a bit too technical for me at times, but still, it's a testament to human ingenuity. Keep pushing the boundaries! 🧠

WillieJackson
WillieJackson 2025-04-20 17:42:21

¡Los académicos de IA que recibieron el Premio Turing por la técnica detrás de la victoria de AlphaGo en el ajedrez me dejaron asombrado! Usar el aprendizaje por refuerzo para ganar es genial. Me gustaría entender mejor la tecnología, pero aún así es muy cool! 🤓

OR