DeepMind的AGI安全纸无法解决怀疑论者

在周三,谷歌DeepMind发布了一份长达145页的论文,深入探讨了他们对AGI安全的处理方法。AGI,即通用人工智能,是能够处理人类能完成的任何任务的AI类型,在AI领域备受关注。一些人认为这只是幻想,而像Anthropic这样的巨头则相信它即将来临,如果我们不完善安全措施,可能会引发严重问题。
DeepMind的论文,由联合创始人Shane Legg协助撰写,认为AGI可能在2030年前出现,并可能导致他们所谓的“严重危害”。他们没有明确说明,但使用了“存在风险”等可怕术语,可能“永久摧毁人类”。
“我们在赌本世纪末前会看到卓越的AGI,”作者指出。“卓越的AGI是一个系统,能够在许多非体力任务上匹配前1%的成人技能,包括学习新技能等复杂任务。”
论文一开始就将DeepMind处理AGI风险的方式与Anthropic和OpenAI进行了比较。它说Anthropic不太注重“稳健的训练、监控和安全”,而OpenAI则专注于“自动化”一种称为对齐研究的AI安全研究。
论文还对超级智能AI——比任何人类都擅长工作的AI——这一概念提出质疑。(OpenAI最近表示他们正将重点从AGI转向超级智能。)DeepMind的作者认为,没有重大突破,超级智能系统不会很快出现——甚至可能永远不会。
但他们认为,当前方法可能导致“递归AI改进”,即AI进行自己的AI研究,制造更智能的AI系统。他们警告,这可能极其危险。
总体而言,论文建议我们需要开发方法,防止不良行为者接触AGI,更好地理解AI系统的行为,并使AI运行的环境更安全。他们承认许多想法仍处于早期阶段,存在“开放研究问题”,但敦促我们不要忽视可能出现的安全问题。
“AGI可能带来巨大好处或严重危害,”作者指出。“因此,要正确构建AGI,顶级AI开发者必须提前计划,应对这些重大风险。”
然而,并非所有人都认同论文的观点。
非营利组织AI Now Institute的首席AI科学家Heidy Khlaaf对TechCrunch表示,她认为AGI概念过于模糊,无法“进行严谨的科学评估”。另一位AI研究员、阿尔伯塔大学的Matthew Guzdial表示,他不相信递归AI改进目前可行。
“递归改进是智能奇点论点的基础,”Guzdial对TechCrunch说,“但我们从未见过任何证据证明它真的有效。”
牛津大学研究技术和监管的Sandra Wachter指出一个更紧迫的担忧:AI用“不准确输出”强化自身。
“随着网上越来越多的AI生成内容和真实数据被替换,模型正在从自己的充满不准确或幻觉的输出中学习,”她对TechCrunch说。“由于聊天机器人主要用于搜索和寻找真相,我们总是面临被虚假信息误导的风险,这些信息以非常令人信服的方式呈现。”
尽管DeepMind的论文非常详尽,但它可能无法终结关于AGI可能性以及哪些AI安全问题最需要关注的争论。
相关文章
OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图
正当各国政府竭力应对超级智能机器带来的经济影响之际,OpenAI发布了一套政策建议,概述了在“智能时代”财富与工作将如何重塑。这些构想将传统左倾机制——例如公共财富基金和扩大的社会安全网——与根本上属于资本主义、由市场驱动的经济框架相结合。OpenAI的提案本质上是一份愿望清单,这份公开声明旨在帮助民选官员、投资者和公众理解这家市值8520亿美元的公司如何看待人工智能在重塑劳动力和经济过程中带来的
Databricks联合创始人获ACM奖后宣称通用人工智能即将到来
Databricks联合创始人兼首席技术官马泰·扎哈里亚(Matei Zaharia)差点就忽略了那封通知他荣获2026年ACM计算奖的邮件。“这确实是个惊喜,”他向TechCrunch透露道。2009年,扎哈里亚在加州大学伯克利分校攻读博士期间,在著名教授伊昂·斯托伊卡(Ion Stoica)的指导下开发的技术被整合到了Databricks中。扎哈里亚设计了一种方法,能显著加速处理那些缓慢且繁琐
OpenAI创始人山姆·阿尔特曼宣告超级智能时代来临
OpenAI首席执行官山姆·奥尔特曼宣布,人类已进入人工智能超级智能时代,且无法回头。"我们已越过不可逆转的临界点,上升阶段正式开启,"奥特曼表示,"人类正站在创造数字超级智能的边缘,而迄今为止,其发展态势竟比想象中更不令人感到陌生。"尽管缺乏明显迹象——街头尚未遍布机器人,疾病依然存在——但奥特曼所描述的深刻变革已悄然启动。在他这样的公司内部,正在研发能够超越人类通用智能的系统。"从重要意义上说
相关专题推荐
评论 (52)
0/500
Interesting read! But honestly, a 145-page paper from DeepMind feels more like a corporate PR move than a real solution. Can we really trust the same companies racing to build AGI to also be the ones setting safety rules? 🧐 It's like letting foxes design the henhouse security. I'd love to see more independent oversight and less glossy documentation.
Este artículo me hace pensar que la seguridad de AGI es como intentar construir un paracaídas mientras ya estás cayendo del avión. DeepMind tiene buenas intenciones, pero 145 páginas no van a convencer a los escépticos si no demuestran resultados prácticos. 🤔 ¿Alguien más siente que estas discusiones se repiten cada seis meses sin avances reales?
Mais um artigo gigante sobre segurança de AGI... Será que alguém realmente lê essas 145 páginas? 🤨 Parece que o DeepMind tá mais preocupado em mostrar volume do que convencer os críticos. Cadê os resultados práticos?
Este artículo sobre seguridad en AGI es interesante, pero me pregunto si realmente podemos confiar en las grandes empresas tecnológicas para autorregularse. 🤨 DeepMind habla de seguridad, pero al final todo se reduce a ganancias y competencia. ¿Será solo otro documento para calmar a los reguladores?
This paper's a beast, but I'm not sold on DeepMind's AGI safety promises. Feels like they're hyping it up without tackling the real ethical mess. Anyone else think it's just fancy PR? 🤔

在周三,谷歌DeepMind发布了一份长达145页的论文,深入探讨了他们对AGI安全的处理方法。AGI,即通用人工智能,是能够处理人类能完成的任何任务的AI类型,在AI领域备受关注。一些人认为这只是幻想,而像Anthropic这样的巨头则相信它即将来临,如果我们不完善安全措施,可能会引发严重问题。
DeepMind的论文,由联合创始人Shane Legg协助撰写,认为AGI可能在2030年前出现,并可能导致他们所谓的“严重危害”。他们没有明确说明,但使用了“存在风险”等可怕术语,可能“永久摧毁人类”。
“我们在赌本世纪末前会看到卓越的AGI,”作者指出。“卓越的AGI是一个系统,能够在许多非体力任务上匹配前1%的成人技能,包括学习新技能等复杂任务。”
论文一开始就将DeepMind处理AGI风险的方式与Anthropic和OpenAI进行了比较。它说Anthropic不太注重“稳健的训练、监控和安全”,而OpenAI则专注于“自动化”一种称为对齐研究的AI安全研究。
论文还对超级智能AI——比任何人类都擅长工作的AI——这一概念提出质疑。(OpenAI最近表示他们正将重点从AGI转向超级智能。)DeepMind的作者认为,没有重大突破,超级智能系统不会很快出现——甚至可能永远不会。
但他们认为,当前方法可能导致“递归AI改进”,即AI进行自己的AI研究,制造更智能的AI系统。他们警告,这可能极其危险。
总体而言,论文建议我们需要开发方法,防止不良行为者接触AGI,更好地理解AI系统的行为,并使AI运行的环境更安全。他们承认许多想法仍处于早期阶段,存在“开放研究问题”,但敦促我们不要忽视可能出现的安全问题。
“AGI可能带来巨大好处或严重危害,”作者指出。“因此,要正确构建AGI,顶级AI开发者必须提前计划,应对这些重大风险。”
然而,并非所有人都认同论文的观点。
非营利组织AI Now Institute的首席AI科学家Heidy Khlaaf对TechCrunch表示,她认为AGI概念过于模糊,无法“进行严谨的科学评估”。另一位AI研究员、阿尔伯塔大学的Matthew Guzdial表示,他不相信递归AI改进目前可行。
“递归改进是智能奇点论点的基础,”Guzdial对TechCrunch说,“但我们从未见过任何证据证明它真的有效。”
牛津大学研究技术和监管的Sandra Wachter指出一个更紧迫的担忧:AI用“不准确输出”强化自身。
“随着网上越来越多的AI生成内容和真实数据被替换,模型正在从自己的充满不准确或幻觉的输出中学习,”她对TechCrunch说。“由于聊天机器人主要用于搜索和寻找真相,我们总是面临被虚假信息误导的风险,这些信息以非常令人信服的方式呈现。”
尽管DeepMind的论文非常详尽,但它可能无法终结关于AGI可能性以及哪些AI安全问题最需要关注的争论。
OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图
正当各国政府竭力应对超级智能机器带来的经济影响之际,OpenAI发布了一套政策建议,概述了在“智能时代”财富与工作将如何重塑。这些构想将传统左倾机制——例如公共财富基金和扩大的社会安全网——与根本上属于资本主义、由市场驱动的经济框架相结合。OpenAI的提案本质上是一份愿望清单,这份公开声明旨在帮助民选官员、投资者和公众理解这家市值8520亿美元的公司如何看待人工智能在重塑劳动力和经济过程中带来的
Databricks联合创始人获ACM奖后宣称通用人工智能即将到来
Databricks联合创始人兼首席技术官马泰·扎哈里亚(Matei Zaharia)差点就忽略了那封通知他荣获2026年ACM计算奖的邮件。“这确实是个惊喜,”他向TechCrunch透露道。2009年,扎哈里亚在加州大学伯克利分校攻读博士期间,在著名教授伊昂·斯托伊卡(Ion Stoica)的指导下开发的技术被整合到了Databricks中。扎哈里亚设计了一种方法,能显著加速处理那些缓慢且繁琐
Interesting read! But honestly, a 145-page paper from DeepMind feels more like a corporate PR move than a real solution. Can we really trust the same companies racing to build AGI to also be the ones setting safety rules? 🧐 It's like letting foxes design the henhouse security. I'd love to see more independent oversight and less glossy documentation.
Este artículo me hace pensar que la seguridad de AGI es como intentar construir un paracaídas mientras ya estás cayendo del avión. DeepMind tiene buenas intenciones, pero 145 páginas no van a convencer a los escépticos si no demuestran resultados prácticos. 🤔 ¿Alguien más siente que estas discusiones se repiten cada seis meses sin avances reales?
Mais um artigo gigante sobre segurança de AGI... Será que alguém realmente lê essas 145 páginas? 🤨 Parece que o DeepMind tá mais preocupado em mostrar volume do que convencer os críticos. Cadê os resultados práticos?
Este artículo sobre seguridad en AGI es interesante, pero me pregunto si realmente podemos confiar en las grandes empresas tecnológicas para autorregularse. 🤨 DeepMind habla de seguridad, pero al final todo se reduce a ganancias y competencia. ¿Será solo otro documento para calmar a los reguladores?
This paper's a beast, but I'm not sold on DeepMind's AGI safety promises. Feels like they're hyping it up without tackling the real ethical mess. Anyone else think it's just fancy PR? 🤔





首页






