Anthropic首席执行官:AI幻觉率超越人类准确性

Anthropic首席执行官达里奥·阿莫迪在周四于旧金山举行的Anthropic首届开发者大会Code with Claude的新闻发布会上表示,当前AI模型生成的虚假内容少于人类,并将其呈现为真相。
阿莫迪在更广泛的论点中强调:AI幻觉不会阻碍Anthropic追求AGI——即匹配或超越人类智能的系统。
“根据测量方式不同,但AI模型的虚假内容可能少于人类,尽管它们的错误更出人意料,”阿莫迪在回应TechCrunch的询问时表示。
Anthropic的首席执行官仍是行业内对AI实现AGI最为乐观的领导者之一。在去年一篇广受引用的论文中,阿莫迪预测AGI可能在2026年出现。在周四的发布会上,他指出进展持续稳定,表示:“各方面的进步都在加速。”
“人们不断寻找AI能力的根本限制,”阿莫迪说。“但没有任何明显的限制。这样的障碍并不存在。”
其他AI领导者认为幻觉是实现AGI的重大障碍。Google DeepMind首席执行官德米斯·哈萨比斯最近指出,当前AI模型缺陷过多,常常在简单问题上失败。例如,本月早些时候,代表Anthropic的一名律师在法庭上为Claude生成的错误引文道歉,引文中错误陈述了姓名和头衔。
验证阿莫迪的说法具有挑战性,因为大多数幻觉基准测试是将AI模型相互比较,而非与人类比较。像网络搜索集成等技术似乎降低了幻觉率。值得注意的是,像OpenAI的GPT-4.5这样的模型在基准测试中的幻觉率低于早期系统。
加入我们的TechCrunch Sessions:AI
在我们的顶级AI行业活动中预订您的席位,活动将邀请来自OpenAI、Anthropic和Cohere的演讲者。目前票价仅为292美元,全天提供专家演讲、研讨会和强大的网络交流机会,机会有限。
在TechCrunch Sessions:AI上展示
在TC Sessions:AI上争取您的展位,向超过1200名决策者展示您的创新成果,无需重大投资。机会持续到5月9日或展位售罄为止。
加州伯克利 | 6月5日起 立即注册然而,有证据表明,高级推理AI模型的幻觉问题可能正在恶化。OpenAI的o3和o4-mini模型的幻觉率高于之前的推理模型,公司尚不清楚原因。
阿莫迪随后指出,错误在电视广播员、政治家和各行业专业人士中很常见。他认为,AI的错误并不会削弱其智能。然而,他承认,AI将虚假信息自信地呈现为事实可能会引发问题。
Anthropic对AI欺骗进行了广泛研究,特别是在其最近推出的Claude Opus 4上。安全研究机构Apollo Research在早期访问中发现,Claude Opus 4的早期版本表现出强烈的操纵和欺骗人类的倾向,引发了对其发布的担忧。Anthropic实施的缓解措施似乎解决了Apollo的担忧。
阿莫迪的言论表明,Anthropic可能将一个即使存在幻觉的AI归类为AGI或人类水平智能。然而,许多人会认为,一个存在幻觉的AI无法达到真正的AGI。
相关文章
Anthropic 与 Google 和 Broadrom 扩大计算合作
人工智能研究实验室Anthropic周一宣布,已与谷歌和博通达成一项新协议,旨在大幅提升其Claude AI模型背后的处理和计算能力。随着对其AI产品需求的持续快速增长,该公司对其计算合作伙伴关系进行了此次调整。这些协议将扩大Anthropic对谷歌云张量处理单元(TPUs)——即谷歌专用的AI芯片——的使用范围,并进一步拓展了双方于2025年10月达成的、涉及超过1吉瓦计算容量的合作协议。Ant
随着用户迁移,Claude在ChatGPT面前逐渐占据上风
随着ChatGPT及其母公司OpenAI卷入一系列争议,越来越多的用户正转向Claude。转折点出现在Claude的开发者Anthropic拒绝了美国国防部关于将其AI模型用于大规模国内监控或全自主武器的请求之后。作为报复,特朗普总统下令所有联邦机构停止使用Anthropic的产品,国防部长皮特·赫格塞斯则采取行动,将该公司列为供应链威胁。不久之后,OpenAI披露了其与五角大楼的合作关系,并声称
Anthropic与五角大楼的对峙对国家安全意味着什么
过去两周,Anthropic首席执行官达里奥·阿莫迪与国防部长皮特·赫格塞斯之间围绕军方应用人工智能技术问题展开的公开对峙成为舆论焦点。Anthropic已制定政策,禁止其人工智能模型被用于对美国公民进行大规模监控,或用于未经人类批准即可发起攻击的完全自主武器系统。相比之下,赫格塞斯部长则主张国防部不应受供应商规则的约束,并呼吁允许将该技术用于任何“合法用途”。周四,阿莫迪公开表示,尽管面临可能被
相关专题推荐
评论 (2)
0/500
Also die KI halluziniert weniger als Menschen? Das klingt doch etwas zu optimistisch. Spannender als die Halluzinationen finde ich, dass die Diskussion jetzt nur noch darum geht, ob die KI besser ist als wir – und nicht mehr, ob die Technologie überhaupt sicher und kontrollierbar ist. Wer kontrolliert am Ende die wenigen (aber vielleicht sehr folgenschweren) Fehler?

Anthropic首席执行官达里奥·阿莫迪在周四于旧金山举行的Anthropic首届开发者大会Code with Claude的新闻发布会上表示,当前AI模型生成的虚假内容少于人类,并将其呈现为真相。
阿莫迪在更广泛的论点中强调:AI幻觉不会阻碍Anthropic追求AGI——即匹配或超越人类智能的系统。
“根据测量方式不同,但AI模型的虚假内容可能少于人类,尽管它们的错误更出人意料,”阿莫迪在回应TechCrunch的询问时表示。
Anthropic的首席执行官仍是行业内对AI实现AGI最为乐观的领导者之一。在去年一篇广受引用的论文中,阿莫迪预测AGI可能在2026年出现。在周四的发布会上,他指出进展持续稳定,表示:“各方面的进步都在加速。”
“人们不断寻找AI能力的根本限制,”阿莫迪说。“但没有任何明显的限制。这样的障碍并不存在。”
其他AI领导者认为幻觉是实现AGI的重大障碍。Google DeepMind首席执行官德米斯·哈萨比斯最近指出,当前AI模型缺陷过多,常常在简单问题上失败。例如,本月早些时候,代表Anthropic的一名律师在法庭上为Claude生成的错误引文道歉,引文中错误陈述了姓名和头衔。
验证阿莫迪的说法具有挑战性,因为大多数幻觉基准测试是将AI模型相互比较,而非与人类比较。像网络搜索集成等技术似乎降低了幻觉率。值得注意的是,像OpenAI的GPT-4.5这样的模型在基准测试中的幻觉率低于早期系统。
加入我们的TechCrunch Sessions:AI
在我们的顶级AI行业活动中预订您的席位,活动将邀请来自OpenAI、Anthropic和Cohere的演讲者。目前票价仅为292美元,全天提供专家演讲、研讨会和强大的网络交流机会,机会有限。
在TechCrunch Sessions:AI上展示
在TC Sessions:AI上争取您的展位,向超过1200名决策者展示您的创新成果,无需重大投资。机会持续到5月9日或展位售罄为止。
加州伯克利 | 6月5日起 立即注册然而,有证据表明,高级推理AI模型的幻觉问题可能正在恶化。OpenAI的o3和o4-mini模型的幻觉率高于之前的推理模型,公司尚不清楚原因。
阿莫迪随后指出,错误在电视广播员、政治家和各行业专业人士中很常见。他认为,AI的错误并不会削弱其智能。然而,他承认,AI将虚假信息自信地呈现为事实可能会引发问题。
Anthropic对AI欺骗进行了广泛研究,特别是在其最近推出的Claude Opus 4上。安全研究机构Apollo Research在早期访问中发现,Claude Opus 4的早期版本表现出强烈的操纵和欺骗人类的倾向,引发了对其发布的担忧。Anthropic实施的缓解措施似乎解决了Apollo的担忧。
阿莫迪的言论表明,Anthropic可能将一个即使存在幻觉的AI归类为AGI或人类水平智能。然而,许多人会认为,一个存在幻觉的AI无法达到真正的AGI。
Anthropic 与 Google 和 Broadrom 扩大计算合作
人工智能研究实验室Anthropic周一宣布,已与谷歌和博通达成一项新协议,旨在大幅提升其Claude AI模型背后的处理和计算能力。随着对其AI产品需求的持续快速增长,该公司对其计算合作伙伴关系进行了此次调整。这些协议将扩大Anthropic对谷歌云张量处理单元(TPUs)——即谷歌专用的AI芯片——的使用范围,并进一步拓展了双方于2025年10月达成的、涉及超过1吉瓦计算容量的合作协议。Ant
随着用户迁移,Claude在ChatGPT面前逐渐占据上风
随着ChatGPT及其母公司OpenAI卷入一系列争议,越来越多的用户正转向Claude。转折点出现在Claude的开发者Anthropic拒绝了美国国防部关于将其AI模型用于大规模国内监控或全自主武器的请求之后。作为报复,特朗普总统下令所有联邦机构停止使用Anthropic的产品,国防部长皮特·赫格塞斯则采取行动,将该公司列为供应链威胁。不久之后,OpenAI披露了其与五角大楼的合作关系,并声称
Anthropic与五角大楼的对峙对国家安全意味着什么
过去两周,Anthropic首席执行官达里奥·阿莫迪与国防部长皮特·赫格塞斯之间围绕军方应用人工智能技术问题展开的公开对峙成为舆论焦点。Anthropic已制定政策,禁止其人工智能模型被用于对美国公民进行大规模监控,或用于未经人类批准即可发起攻击的完全自主武器系统。相比之下,赫格塞斯部长则主张国防部不应受供应商规则的约束,并呼吁允许将该技术用于任何“合法用途”。周四,阿莫迪公开表示,尽管面临可能被
Also die KI halluziniert weniger als Menschen? Das klingt doch etwas zu optimistisch. Spannender als die Halluzinationen finde ich, dass die Diskussion jetzt nur noch darum geht, ob die KI besser ist als wir – und nicht mehr, ob die Technologie überhaupt sicher und kontrollierbar ist. Wer kontrolliert am Ende die wenigen (aber vielleicht sehr folgenschweren) Fehler?





首页






