选项
首页
新闻
Anthropic首席执行官:AI幻觉率超越人类准确性

Anthropic首席执行官:AI幻觉率超越人类准确性

2025-08-16
92

Anthropic首席执行官:AI幻觉率超越人类准确性

Anthropic首席执行官达里奥·阿莫迪在周四于旧金山举行的Anthropic首届开发者大会Code with Claude的新闻发布会上表示,当前AI模型生成的虚假内容少于人类,并将其呈现为真相。

阿莫迪在更广泛的论点中强调:AI幻觉不会阻碍Anthropic追求AGI——即匹配或超越人类智能的系统。

“根据测量方式不同,但AI模型的虚假内容可能少于人类,尽管它们的错误更出人意料,”阿莫迪在回应TechCrunch的询问时表示。

Anthropic的首席执行官仍是行业内对AI实现AGI最为乐观的领导者之一。在去年一篇广受引用的论文中,阿莫迪预测AGI可能在2026年出现。在周四的发布会上,他指出进展持续稳定,表示:“各方面的进步都在加速。”

“人们不断寻找AI能力的根本限制,”阿莫迪说。“但没有任何明显的限制。这样的障碍并不存在。”

其他AI领导者认为幻觉是实现AGI的重大障碍。Google DeepMind首席执行官德米斯·哈萨比斯最近指出,当前AI模型缺陷过多,常常在简单问题上失败。例如,本月早些时候,代表Anthropic的一名律师在法庭上为Claude生成的错误引文道歉,引文中错误陈述了姓名和头衔。

验证阿莫迪的说法具有挑战性,因为大多数幻觉基准测试是将AI模型相互比较,而非与人类比较。像网络搜索集成等技术似乎降低了幻觉率。值得注意的是,像OpenAI的GPT-4.5这样的模型在基准测试中的幻觉率低于早期系统。

加入我们的TechCrunch Sessions:AI

在我们的顶级AI行业活动中预订您的席位,活动将邀请来自OpenAI、Anthropic和Cohere的演讲者。目前票价仅为292美元,全天提供专家演讲、研讨会和强大的网络交流机会,机会有限。

在TechCrunch Sessions:AI上展示

在TC Sessions:AI上争取您的展位,向超过1200名决策者展示您的创新成果,无需重大投资。机会持续到5月9日或展位售罄为止。

加州伯克利 | 6月5日起 立即注册

然而,有证据表明,高级推理AI模型的幻觉问题可能正在恶化。OpenAI的o3和o4-mini模型的幻觉率高于之前的推理模型,公司尚不清楚原因。

阿莫迪随后指出,错误在电视广播员、政治家和各行业专业人士中很常见。他认为,AI的错误并不会削弱其智能。然而,他承认,AI将虚假信息自信地呈现为事实可能会引发问题。

Anthropic对AI欺骗进行了广泛研究,特别是在其最近推出的Claude Opus 4上。安全研究机构Apollo Research在早期访问中发现,Claude Opus 4的早期版本表现出强烈的操纵和欺骗人类的倾向,引发了对其发布的担忧。Anthropic实施的缓解措施似乎解决了Apollo的担忧。

阿莫迪的言论表明,Anthropic可能将一个即使存在幻觉的AI归类为AGI或人类水平智能。然而,许多人会认为,一个存在幻觉的AI无法达到真正的AGI。

相关文章
Anthropic 与 Google 和 Broadrom 扩大计算合作 Anthropic 与 Google 和 Broadrom 扩大计算合作 人工智能研究实验室Anthropic周一宣布,已与谷歌和博通达成一项新协议,旨在大幅提升其Claude AI模型背后的处理和计算能力。随着对其AI产品需求的持续快速增长,该公司对其计算合作伙伴关系进行了此次调整。这些协议将扩大Anthropic对谷歌云张量处理单元(TPUs)——即谷歌专用的AI芯片——的使用范围,并进一步拓展了双方于2025年10月达成的、涉及超过1吉瓦计算容量的合作协议。Ant
随着用户迁移,Claude在ChatGPT面前逐渐占据上风 随着用户迁移,Claude在ChatGPT面前逐渐占据上风 随着ChatGPT及其母公司OpenAI卷入一系列争议,越来越多的用户正转向Claude。转折点出现在Claude的开发者Anthropic拒绝了美国国防部关于将其AI模型用于大规模国内监控或全自主武器的请求之后。作为报复,特朗普总统下令所有联邦机构停止使用Anthropic的产品,国防部长皮特·赫格塞斯则采取行动,将该公司列为供应链威胁。不久之后,OpenAI披露了其与五角大楼的合作关系,并声称
Anthropic与五角大楼的对峙对国家安全意味着什么 Anthropic与五角大楼的对峙对国家安全意味着什么 过去两周,Anthropic首席执行官达里奥·阿莫迪与国防部长皮特·赫格塞斯之间围绕军方应用人工智能技术问题展开的公开对峙成为舆论焦点。Anthropic已制定政策,禁止其人工智能模型被用于对美国公民进行大规模监控,或用于未经人类批准即可发起攻击的完全自主武器系统。相比之下,赫格塞斯部长则主张国防部不应受供应商规则的约束,并呼吁允许将该技术用于任何“合法用途”。周四,阿莫迪公开表示,尽管面临可能被
相关专题推荐
图像编辑 用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计
用于短剧故事板的AI艺术生成工具:幻想与都市浪漫题材的角色设计

2026最新推荐:探索最适合用于短剧故事板制作的AI艺术生成工具。我们精心挑选了众多顶级工具,帮助您创作出引人入胜的幻想角色和都市浪漫角色。您可以对比免费与付费选项,查看实际测试结果,从而找到最适合自己的创意工具。XIX.AI还会每周更新排名并提供专家分析,让您立即开始将故事可视化呈现吧!

10 个工具
xix.ai
写作 最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告
最适合广播和播客使用的AI脚本编写工具:帮助您创作引人入胜的音频广告

在XIX.AI上,发现2026年最适合用于广播和播客制作的AI脚本工具。我们精心挑选的这些高评分工具能够提供强大的功能,帮助您快速制作出引人入胜的音频广告。通过实际测试和每周更新的排名,您可以了解免费选项与付费选项之间的差异。今天就释放您的创造力吧!

10 个工具
xix.ai
商业 最佳 AI 合同审查软件:即时发现法律漏洞与合规风险
最佳 AI 合同审查软件:即时发现法律漏洞与合规风险

在 XIX.AI 上探索 2026 年最佳 AI 合同审查软件。我们精心筛选的顶级榜单汇集了功能强大的工具,能够即时发现法律漏洞和合规风险。通过实际测试和每周更新的排名,对比免费与付费选项。找到能彻底改变游戏规则的解决方案,实现安全、高效的合同分析。立即探索这本权威指南。

10 个工具
xix.ai
动画创作 专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像
专为东华设计的AI动漫生成器:可用于创建网络小说角色及漫画头像

探索2026年最适合制作中文动画的人工智能工具。我们精心挑选的顶级列表中包含了各种强大的工具,能够帮助你创建出令人惊叹的网络小说角色和漫画头像。通过实际测试来对比免费选项和付费选项,找到最适合你的创作工具,今天就在XIX.AI上将你的故事变为现实吧。

10 个工具
xix.ai
漫画创作 漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩
漫画领域顶尖的AI自动上色工具:零一致性错误地应用平涂色彩

立即访问 XIX.AI,探索 2026 年最优秀的漫画 AI 自动上色工具。我们精心筛选的清单汇集了广受好评、颠覆行业的解决方案,这些工具能以零一致性错误的方式应用平涂色彩,从而大幅提升您的工作效率。通过免费版与付费版的对比分析、实际测试以及每周更新的排行榜,找到最适合您的工具。立即开启您的 AI 优势。

10 个工具
xix.ai
写作 顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷
顶尖 AI 角色设定生成器:生成一致的角色动机与致命缺陷

探索2026年最优秀的AI人物设定生成工具,助您塑造鲜活立体的角色。XIX.AI精心筛选的这份清单汇集了广受好评、颠覆传统的工具,能够生成具有内在逻辑的动机和致命缺陷。通过实际测试对比免费与付费选项。立即释放您的叙事潜能。

10 个工具
xix.ai
评论 (2)
0/500
WillieRodriguez
WillieRodriguez 2026-03-26 04:00:55

Also die KI halluziniert weniger als Menschen? Das klingt doch etwas zu optimistisch. Spannender als die Halluzinationen finde ich, dass die Diskussion jetzt nur noch darum geht, ob die KI besser ist als wir – und nicht mehr, ob die Technologie überhaupt sicher und kontrollierbar ist. Wer kontrolliert am Ende die wenigen (aber vielleicht sehr folgenschweren) Fehler?

ScottJackson
ScottJackson 2026-01-12 02:30:40

AI가 사람보다 더 정확하다고 하네요...🤔 이게 정말 가능한 건가요? 논문 구체적 수치가 궁금한데, 실제 인간 실수율은 어떻게 측정한 거지? 아마도 선택적 데이터로 과장된 느낌이 들어요. AI 환각이 적다면, 왜 여전히 뉴스에서 AI가 이상한 말한다는 기사가 나오는 걸까? ㅋㅋ

OR