Google的DeepMind单位说,AI超出了人类知识的发展
推动人工智能超越传统测试:体验学习的兴起
人工智能(AI)领域正充满活力,努力推动生成式人工智能超越传统基准测试的限制,例如图灵测试,许多模型已经超越了这一测试。现在的重点转向开发不仅为通过这些测试而设计,而是通过更动态的过程进化的AI。
谷歌DeepMind的研究人员,包括David Silver和Richard Sutton等传奇人物,在他们的论文《欢迎体验时代》中提出,解锁新AI能力的关键不在于测试,而在于AI的训练方式。他们认为,目前使用的静态数据集过于有限,无法促进重大进步。
他们的解决方案?AI需要以更体验的方式与世界互动,通过交互学习并根据环境反馈设定目标。他们断言:“一旦充分利用体验学习的潜力,将会出现令人难以置信的新能力。” Silver以其在AlphaZero上的工作而闻名,该模型在国际象棋和围棋中击败了人类,而Sutton则是强化学习的先驱,他们提出了一种称为“流”的新方法,以超越当前大型语言模型(LLMs)的局限性。

谷歌DeepMind 从强化学习到生成式人工智能:转变及其后果
在AlphaZero和AlphaGo成功之后,AI社区转向了像ChatGPT这样的生成式AI模型,这些模型在很大程度上放弃了强化学习。虽然这使得AI能够处理更广泛的自发性人类输入,但也意味着失去了强化学习所启用的自我发现能力。
根据Silver和Sutton的说法,当前的大型语言模型在提示阶段高度依赖人类判断,这限制了它们的潜力。他们解释说:“代理无法发现人类评分者未充分重视的更好策略。”此外,提示交互的短暂、零散性质使得AI无法超越简单的问答交流。
引入流:AI学习的新范式
提出的“体验时代”涉及AI代理在持续交互的“流”中运行,类似于人类在一生中学习的方式。Silver和Sutton设想AI代理拥有自己的长期体验流,使它们能够追求超越即时任务的目标。
这种方法建立在强化学习的基础上,AI代理与世界模型互动,以奖励的形式接收反馈。这些奖励帮助AI学习在不同情境中哪些行动是有价值的。研究人员指出,世界充满了可以作为奖励的信号,从经济指标到健康数据。
构建具有长期目标的AI代理
为了启动这一过程,AI开发者可以使用“世界模型”模拟,让AI进行预测,在现实中测试这些预测,并根据结果优化其模型。随着AI持续与世界互动,其理解能力不断进化,适应新数据并纠正错误。
人类仍将在设定广泛目标方面发挥作用,例如改善健康或学习新语言,AI的奖励函数将与这些目标对齐。这种设置可能导致AI助手在长期内跟踪并建议健康或教育,甚至追求发现新材料或减少碳排放等雄心勃勃的科学目标。
AI的未来:超越推理到体验学习
研究人员认为,能够进行长期体验学习的AI代理可能超越当前像Gemini和DeepSeek的R1这样的“推理”AI模型。他们认为,推理模型常常模仿人类思维,这可能受到过时假设的限制。相比之下,体验式代理可能解锁前所未有的能力,带来与我们所见截然不同的未来。
然而,这种转变也带来了风险,如职业替代和控制长期自主运行的AI代理的挑战。另一方面,适应性强的AI可以通过根据反馈调整行为来学习减轻对人类的负面影响。
Silver和Sutton相信,体验数据的规模和质量将远远超过人类生成的数据,可能导致人工通用智能或超级智能的出现。这种范式转变,结合强化学习的进步,可能在许多领域解锁超越人类能力的新功能。
Silver在最近的DeepMind播客中进一步讨论了这些想法,强调了将AI推向体验时代的潜力与挑战。
相关文章
Qodo与Google Cloud合作,为开发者提供免费AI代码审查工具
Qodo,一家专注于代码质量的以色列AI编码初创公司,已与Google Cloud建立合作关系,以增强AI生成软件的完整性。随着企业越来越依赖AI进行编码,对强大的监督和质量保证工具的需求不断增长。Qodo的首席执行官伊塔马尔·弗里德曼指出,AI生成的代码现已成为现代开发的核心。“想象一个未来,AI编写所有代码;人类无法全部审查,”弗里德曼说。“我们需要系统来确保代码符合预期价值观。”Qodo的创
DeepMind的AI在2025年数学奥林匹克获得金牌
DeepMind的AI在数学推理方面取得惊人飞跃,在2025年国际数学奥林匹克(IMO)中获得金牌,仅在2024年获得银牌一年后。这一突破凸显了AI在解决需要类人创意的复杂抽象问题方面的日益强大。本文探讨了DeepMind的转型之旅、关键技术进步及其里程碑的广泛影响。为何IMO重要自1959年以来,国际数学奥林匹克一直是全球顶尖的高中生数学竞赛。它以代数、几何、数论和组合数学的六个复杂问题挑战参赛
AI驱动的视差制作工具:打造动态2.5D动画
使用视差制作工具将静态图像转化为引人入胜的2.5D动画。この开源工具赋予艺术家和游戏开发者为作品注入深度和动态的能力。借助Stability AI API,视差制作工具确保即使在普通硬件上也能实现流畅的工作流程。探索此工具的功能及其如何提升您的创意项目。主要亮点视差制作工具是一个用于制作2.5D动画的开源解决方案。它将图像转化为与Blender和Unreal Engine兼容的动画。与Stabil
评论 (9)
0/200
WalterNelson
2025-08-19 14:26:53
AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀
0
ScottWalker
2025-08-15 23:00:59
AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀
0
AlbertGarcía
2025-08-08 10:00:59
Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?
0
FrankSanchez
2025-07-28 09:20:02
This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!
0
CarlGarcia
2025-04-28 02:31:27
AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!
0
PaulTaylor
2025-04-27 23:12:58
¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!
0
推动人工智能超越传统测试:体验学习的兴起
人工智能(AI)领域正充满活力,努力推动生成式人工智能超越传统基准测试的限制,例如图灵测试,许多模型已经超越了这一测试。现在的重点转向开发不仅为通过这些测试而设计,而是通过更动态的过程进化的AI。
谷歌DeepMind的研究人员,包括David Silver和Richard Sutton等传奇人物,在他们的论文《欢迎体验时代》中提出,解锁新AI能力的关键不在于测试,而在于AI的训练方式。他们认为,目前使用的静态数据集过于有限,无法促进重大进步。
他们的解决方案?AI需要以更体验的方式与世界互动,通过交互学习并根据环境反馈设定目标。他们断言:“一旦充分利用体验学习的潜力,将会出现令人难以置信的新能力。” Silver以其在AlphaZero上的工作而闻名,该模型在国际象棋和围棋中击败了人类,而Sutton则是强化学习的先驱,他们提出了一种称为“流”的新方法,以超越当前大型语言模型(LLMs)的局限性。
从强化学习到生成式人工智能:转变及其后果
在AlphaZero和AlphaGo成功之后,AI社区转向了像ChatGPT这样的生成式AI模型,这些模型在很大程度上放弃了强化学习。虽然这使得AI能够处理更广泛的自发性人类输入,但也意味着失去了强化学习所启用的自我发现能力。
根据Silver和Sutton的说法,当前的大型语言模型在提示阶段高度依赖人类判断,这限制了它们的潜力。他们解释说:“代理无法发现人类评分者未充分重视的更好策略。”此外,提示交互的短暂、零散性质使得AI无法超越简单的问答交流。
引入流:AI学习的新范式
提出的“体验时代”涉及AI代理在持续交互的“流”中运行,类似于人类在一生中学习的方式。Silver和Sutton设想AI代理拥有自己的长期体验流,使它们能够追求超越即时任务的目标。
这种方法建立在强化学习的基础上,AI代理与世界模型互动,以奖励的形式接收反馈。这些奖励帮助AI学习在不同情境中哪些行动是有价值的。研究人员指出,世界充满了可以作为奖励的信号,从经济指标到健康数据。
构建具有长期目标的AI代理
为了启动这一过程,AI开发者可以使用“世界模型”模拟,让AI进行预测,在现实中测试这些预测,并根据结果优化其模型。随着AI持续与世界互动,其理解能力不断进化,适应新数据并纠正错误。
人类仍将在设定广泛目标方面发挥作用,例如改善健康或学习新语言,AI的奖励函数将与这些目标对齐。这种设置可能导致AI助手在长期内跟踪并建议健康或教育,甚至追求发现新材料或减少碳排放等雄心勃勃的科学目标。
AI的未来:超越推理到体验学习
研究人员认为,能够进行长期体验学习的AI代理可能超越当前像Gemini和DeepSeek的R1这样的“推理”AI模型。他们认为,推理模型常常模仿人类思维,这可能受到过时假设的限制。相比之下,体验式代理可能解锁前所未有的能力,带来与我们所见截然不同的未来。
然而,这种转变也带来了风险,如职业替代和控制长期自主运行的AI代理的挑战。另一方面,适应性强的AI可以通过根据反馈调整行为来学习减轻对人类的负面影响。
Silver和Sutton相信,体验数据的规模和质量将远远超过人类生成的数据,可能导致人工通用智能或超级智能的出现。这种范式转变,结合强化学习的进步,可能在许多领域解锁超越人类能力的新功能。
Silver在最近的DeepMind播客中进一步讨论了这些想法,强调了将AI推向体验时代的潜力与挑战。



AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀




AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀




Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?




This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!




AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!




¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!












