选项
首页
新闻
Google的DeepMind单位说,AI超出了人类知识的发展

Google的DeepMind单位说,AI超出了人类知识的发展

2025-04-26
149

推动人工智能超越传统测试:体验学习的兴起

人工智能(AI)领域正充满活力,努力推动生成式人工智能超越传统基准测试的限制,例如图灵测试,许多模型已经超越了这一测试。现在的重点转向开发不仅为通过这些测试而设计,而是通过更动态的过程进化的AI。

谷歌DeepMind的研究人员,包括David Silver和Richard Sutton等传奇人物,在他们的论文《欢迎体验时代》中提出,解锁新AI能力的关键不在于测试,而在于AI的训练方式。他们认为,目前使用的静态数据集过于有限,无法促进重大进步。

他们的解决方案?AI需要以更体验的方式与世界互动,通过交互学习并根据环境反馈设定目标。他们断言:“一旦充分利用体验学习的潜力,将会出现令人难以置信的新能力。” Silver以其在AlphaZero上的工作而闻名,该模型在国际象棋和围棋中击败了人类,而Sutton则是强化学习的先驱,他们提出了一种称为“流”的新方法,以超越当前大型语言模型(LLMs)的局限性。

谷歌DeepMind

谷歌DeepMind

从强化学习到生成式人工智能:转变及其后果

在AlphaZero和AlphaGo成功之后,AI社区转向了像ChatGPT这样的生成式AI模型,这些模型在很大程度上放弃了强化学习。虽然这使得AI能够处理更广泛的自发性人类输入,但也意味着失去了强化学习所启用的自我发现能力。

根据Silver和Sutton的说法,当前的大型语言模型在提示阶段高度依赖人类判断,这限制了它们的潜力。他们解释说:“代理无法发现人类评分者未充分重视的更好策略。”此外,提示交互的短暂、零散性质使得AI无法超越简单的问答交流。

引入流:AI学习的新范式

提出的“体验时代”涉及AI代理在持续交互的“流”中运行,类似于人类在一生中学习的方式。Silver和Sutton设想AI代理拥有自己的长期体验流,使它们能够追求超越即时任务的目标。

这种方法建立在强化学习的基础上,AI代理与世界模型互动,以奖励的形式接收反馈。这些奖励帮助AI学习在不同情境中哪些行动是有价值的。研究人员指出,世界充满了可以作为奖励的信号,从经济指标到健康数据。

构建具有长期目标的AI代理

为了启动这一过程,AI开发者可以使用“世界模型”模拟,让AI进行预测,在现实中测试这些预测,并根据结果优化其模型。随着AI持续与世界互动,其理解能力不断进化,适应新数据并纠正错误。

人类仍将在设定广泛目标方面发挥作用,例如改善健康或学习新语言,AI的奖励函数将与这些目标对齐。这种设置可能导致AI助手在长期内跟踪并建议健康或教育,甚至追求发现新材料或减少碳排放等雄心勃勃的科学目标。

AI的未来:超越推理到体验学习

研究人员认为,能够进行长期体验学习的AI代理可能超越当前像Gemini和DeepSeek的R1这样的“推理”AI模型。他们认为,推理模型常常模仿人类思维,这可能受到过时假设的限制。相比之下,体验式代理可能解锁前所未有的能力,带来与我们所见截然不同的未来。

然而,这种转变也带来了风险,如职业替代和控制长期自主运行的AI代理的挑战。另一方面,适应性强的AI可以通过根据反馈调整行为来学习减轻对人类的负面影响。

Silver和Sutton相信,体验数据的规模和质量将远远超过人类生成的数据,可能导致人工通用智能或超级智能的出现。这种范式转变,结合强化学习的进步,可能在许多领域解锁超越人类能力的新功能。

Silver在最近的DeepMind播客中进一步讨论了这些想法,强调了将AI推向体验时代的潜力与挑战。

相关文章
美国将因社交媒体法规制裁外国官员 美国将因社交媒体法规制裁外国官员 美国站出来反对全球数字内容法规美国国务院本周针对欧洲的数字治理政策发出了尖锐的外交斥责,表明在网络平台控制权问题上的紧张局势正在升级。国务卿马可-卢比奥(Marco Rubio)公布了一项新的签证限制政策,该政策针对的是参与美国认为影响美国数字空间的过度审查的外国官员。新签证限制解释根据周三宣布的政策,美国将拒绝被认定正在执行影响美国受保护言论的海外内容法规的外国公民入境。卢比奥强调了两
人工智能驱动的 YouTube 视频摘要器终极指南 人工智能驱动的 YouTube 视频摘要器终极指南 在我们信息丰富的数字环境中,人工智能驱动的 YouTube 视频摘要器已成为高效内容消费不可或缺的工具。本深度指南探讨了如何利用最先进的 NLP 技术(特别是来自 Hugging Face 的 BART 模型与 YouTube 的 Transcript API 相结合)构建复杂的摘要工具。无论您是要开发生产力工具、增强可访问性解决方案,还是要创建教育资源,本指南都能为您提供实现专业级摘要所需的一切
Atlassian 斥资 6.1 亿美元收购浏览器公司,加强开发人员工具 Atlassian 斥资 6.1 亿美元收购浏览器公司,加强开发人员工具 企业生产力软件领导者 Atlassian 宣布,计划以 6.1 亿美元的全现金交易收购创新型浏览器开发商 The Browser Company。这一战略举措旨在通过整合为现代知识工作者量身定制的人工智能功能,彻底改变工作场所的浏览方式。"Atlassian首席执行官兼联合创始人迈克-坎农-布鲁克斯(Mike Cannon-Brookes)表示:"传统浏览器是为休闲网上冲浪而设计的,而不是为当
评论 (10)
0/200
SophiaCampbell
SophiaCampbell 2025-08-26 13:59:22

It's wild how AI is outpacing human knowledge! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see where this takes us, but I hope they keep ethics in check! 😎

WalterNelson
WalterNelson 2025-08-19 14:26:53

AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀

ScottWalker
ScottWalker 2025-08-15 23:00:59

AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀

AlbertGarcía
AlbertGarcía 2025-08-08 10:00:59

Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?

FrankSanchez
FrankSanchez 2025-07-28 09:20:02

This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!

CarlGarcia
CarlGarcia 2025-04-28 02:31:27

AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!

返回顶部
OR