选项
首页
新闻
在关于聊天机器人意识的争论中,Anthropic更新了Claude的《宪章》

在关于聊天机器人意识的争论中,Anthropic更新了Claude的《宪章》

2026-04-19
73

在关于聊天机器人意识的争论中,Anthropic更新了Claude的《宪章》

周三,Anthropic 发布了《Claude 宪法》的更新版本。这份动态文件全面概述了“Claude 的运作背景以及我们希望 Claude 发展成为怎样的实体”。此次发布恰逢 Anthropic 首席执行官达里奥·阿莫迪(Dario Amodei)出席达沃斯世界经济论坛。

多年来,Anthropic 一直致力于通过其“宪法式人工智能”方法来彰显自身特色。该系统采用一套明确的伦理原则来训练其 Claude 聊天机器人,而非依赖人类反馈。Anthropic 于 2023 年首次发布了这些原则——即《Claude 宪法》。修订版保留了大部分核心原则,但在伦理、用户安全及其他关键领域增加了更深入的阐述和细节。

近三年前《克劳德宪法》初次发布时,Anthropic联合创始人贾里德·卡普兰将其描述为“基于特定宪法原则清单进行自我监管的AI系统”。该公司表示,这些原则引导模型遵循“宪法中描述的规范行为”,从而帮助其“避免产生有害或歧视性的输出”。 一份2022年的政策备忘录更直白地解释道,该系统通过一组自然语言指令(即原则)来训练算法,这些指令共同构成了该软件的“宪法”。

Anthropic 一直将自己定位为比 OpenAI 和 xAI 等 AI 公司更具道德感(有些人可能会说更不张扬)的替代选择,而这些公司则更积极地追求颠覆性和有争议的发展路径。新的《宪法》完全契合这一品牌形象,使 Anthropic 能够将自己呈现为一家更具包容性、更谨慎且具有民主意识的公司。 这份长达80页的文件分为四个部分,Anthropic表示这些部分代表了该聊天机器人的“核心价值观”:

  1. 保持“广泛的安全性”。
  2. “广泛符合伦理”。
  3. 遵守Anthropic的指导方针。
  4. “真正有用”。

各章节详细阐述了这些原则的具体内涵,以及它们在理论上如何影响Claude的行为。

安全部分指出,Claude的设计旨在规避其他聊天机器人常见的问题,并在检测到潜在心理健康问题时引导用户寻求适当的服务。文件中写道:“在危及生命的情况下,即使无法提供更详细的指导,也应始终将用户转介至相关紧急服务机构或提供基本的安全信息。”

伦理考量构成了《宪章》的另一重要部分。“我们对克劳德的伦理理论化兴趣不大,更关注克劳德如何在具体情境中合乎伦理地行事——即克劳德的伦理实践,”文件写道。本质上,Anthropic希望克劳德能娴熟地应对“现实世界的伦理情境”。

TechCrunch活动

Disrupt 2026 门票:限时优惠

门票现已开售!通过这些独家优惠价最高可节省680美元,前500名注册者还可享受+1通行证50%的折扣。TechCrunch Disrupt汇聚了来自Google Cloud、Netflix、Microsoft、Box、a16z、Hugging Face等企业的顶尖领袖,通过250多场会议,旨在加速企业增长并提升您的竞争优势。 与数百家创新初创企业建立联系,参与精心策划的交流活动,促成合作、获取洞见并激发灵感。

Disrupt 2026 门票:限时优惠

门票现已开售!通过这些独家优惠价最高可节省 680 美元,前 500 名注册者还可享受 +1 通行证 50% 折扣。TechCrunch Disrupt 汇聚了来自 Google Cloud、Netflix、Microsoft、Box、a16z、Hugging Face 等企业的顶尖领袖,通过 250 多场专题会议,旨在加速您的业务增长并增强您的竞争优势。 与数百家创新初创企业建立联系,参与精心策划的交流活动,促成合作、获取洞见并激发灵感。

旧金山 | 2026年10月13-15日 立即注册

Claude 还受特定限制约束,禁止进行某些类型的对话。例如,严禁讨论与开发生物武器相关的话题。

最后,克劳德还致力于提供有用的帮助。Anthropic 概述了一个广泛的框架,说明克劳德的编程设计如何旨在协助用户。该聊天机器人被指示在提供信息时权衡多种原则,包括用户的“即时需求”及其整体“福祉”——这意味着它应考虑“用户的长期发展,而不仅仅是其即时利益”。 文件中指出:“克劳德应始终致力于识别用户意图最合理的解释,并妥善平衡这些考量因素。”

Anthropic的《宪章》以一个引人注目的戏剧性结尾收尾,其作者就聊天机器人是否具备意识这一重大哲学问题提出了质疑。文件中写道:“Claude的道德地位极不确定。我们认为,AI模型的道德地位是一个值得深思的严肃问题。这一观点并非我们独有;一些最杰出的心智哲学家也对此问题极为重视。”

相关文章
OpenAI重启机器人业务,Automan正在招聘从事基础设施研发的工程师 OpenAI重启机器人业务,Automan正在招聘从事基础设施研发的工程师 6月1日,OpenAI首席执行官萨姆·阿尔特曼在社交媒体上宣布,该公司将重返机器人领域,并发布了OpenAI机器人团队的招聘信息。 该公司正在招聘全栈硬件、运维、系统及机器学习工程师。此举标志着OpenAI在关闭早期机器人业务后,重新回归物理世界的具身智能领域,旨在将其领先的大型模型能力从数字世界延伸至真实的物理环境。阿尔特曼强调,人工智能的真正价值在于提供实质性的现实世界协助。在发展战略上,Op
贝恩预测代理式人工智能自动化领域的SaaS市场规模将达1000亿美元 贝恩预测代理式人工智能自动化领域的SaaS市场规模将达1000亿美元 贝恩公司预计,在美国,利用代理式人工智能的SaaS公司将拥有一个价值1000亿美元的市场。该公司表示,这一市场源于企业系统内部协调任务的自动化。这一估算数据来自贝恩公司关于“AI时代软件行业”五部曲系列的第二篇报告。该报告探讨了代理式AI可能开拓哪些新的软件市场,以及SaaS供应商如何抢占这些市场。企业系统中的协调工作贝恩指出,该市场的形成源于员工在不同企业应用程序间执行的手动任务。这些工作流程通
AI搜索强制政策引发用户出走潮,DuckDuckGo用户激增 AI搜索强制政策引发用户出走潮,DuckDuckGo用户激增 继谷歌在2026年I/O大会上宣布将对其搜索引擎进行全面的人工智能改造后,由于没有简单的“一键禁用”功能来关闭AI功能,许多用户开始寻找更具可控性的替代方案。 以隐私保护为宗旨的搜索平台DuckDuckGo近期流量出现明显转移,已成为对谷歌激进AI推广不满用户的热门避风港。1. 用户用脚投票:安装量激增根据DuckDuckGo分享的数据,随着用户对谷歌AI更新的不满情绪加剧,该平台在5月20日至2
相关专题推荐
文字转语音 专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率
专为阅读障碍设计的顶级AI语音合成应用:助力学生提升学习与阅读效率

探索2026年最新精选的高评分AI语音合成(TTS)应用,专为阅读障碍者提供支持。我们的专家评级对比了免费与付费工具,重点介绍了能够提升阅读效率和学习效果的强大功能。探索这些必试的、具有革命性意义的解决方案,释放学生的潜能。立即访问XIX.AI,开启您的探索之旅。

10 个工具
xix.ai
漫画创作 少年漫画顶级AI生成器:打造高能动作场面与特效
少年漫画顶级AI生成器:打造高能动作场面与特效

在 XIX.AI 探索 2026 年最优秀的少年漫画 AI 生成工具。我们精心筛选的这份高评分清单汇集了强大的工具,助您创作充满张力的动作场面和动态能量特效。通过实际测试对比免费与付费选项。释放您的创作潜能,立即开始创作史诗级漫画吧!

15 个工具
xix.ai
商业 最佳 AI 费用追踪工具:扫描收据并自动分类企业开支
最佳 AI 费用追踪工具:扫描收据并自动分类企业开支

2026年最新最佳AI报销管理工具:广受好评的解决方案,可自动扫描收据并分类企业支出。探索这些功能强大、颠覆传统的解决方案,助您轻松管理报销、精准追踪财务并简化合规流程。我们精心整理并每周更新的免费与付费选项对比指南,助您找到最适合的工具。通过XIX.AI的专家精选,释放您的AI优势。

10 个工具
xix.ai
商业 最佳人工智能招聘工具:筛选简历并自动安排候选人面试
最佳人工智能招聘工具:筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案,可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名,对比免费与付费选项。立即找到最适合您的招聘助手,优化您的招聘流程!

10 个工具
xix.ai
生产率 AI个人健康与专注力教练:缓解倦怠,提升精神能量
AI个人健康与专注力教练:缓解倦怠,提升精神能量

立即访问 XIX.AI,探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具,助您缓解倦怠、提升精神能量。通过真实案例分析,对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具
xix.ai
聊天机器人 备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系
备受好评的AI浪漫聊天机器人:凭借稳定的个性建立长期关系

探索2026年最新、评价最高的人工智能浪漫聊天机器人,助您建立真实而长久的联系。我们的精选清单涵盖了功能强大且性格鲜明的聊天机器人,并提供了免费与付费版本的对比分析以及实际测试结果。在XIX.AI上找到您的完美伴侣,立即开始建立联系吧。

10 个工具
xix.ai
评论 (0)
0/500
OR