在關於聊天機器人意識的爭論中,Anthropic 更新了 Claude 的架構

週三,Anthropic 公布了「Claude 憲法」的更新版本,這份動態文件全面概述了「Claude 的運作背景,以及我們期望 Claude 成為何種實體」。此次發布正值 Anthropic 執行長達里奧·阿莫迪(Dario Amodei)出席達沃斯世界經濟論壇之際。
多年來,Anthropic 一直致力於透過其「憲法式人工智慧(Constitutional AI)」方法來突顯自身特色。該系統採用一套明確的倫理原則來訓練其 Claude 聊天機器人,而非依賴人類反饋。Anthropic 於 2023 年首次發布了這些原則——即《Claude 憲法》。修訂版保留了大部分核心原則,但在倫理、使用者安全及其他關鍵領域方面,增添了更深入且詳盡的內容。
近三年前《Claude 憲法》初次發布時,Anthropic 共同創辦人傑瑞德·卡普蘭(Jared Kaplan)曾將其描述為「一套基於特定憲法原則清單進行自我監管的人工智慧系統」。該公司表示,這些原則引導模型朝向「憲法中所述的規範性行為」,從而協助其「避免產生有害或具歧視性的輸出內容」。 一份2022年的政策備忘錄更直接地解釋道,該系統是透過一組自然語言指令(即這些原則)來訓練演算法,這些指令共同構成了軟體的「憲法」。
Anthropic 一直將自身定位為比 OpenAI 和 xAI 等 AI 企業更具道德感——有些人可能會說較不花俏——的替代選擇,後者則更積極地追求顛覆性且具爭議性的發展道路。這份新的《憲法》完全符合此品牌形象,讓 Anthropic 得以展現為一家更具包容性、更謹慎且具民主意識的公司。 這份長達 80 頁的文件分為四個部分,Anthropic 表示這些部分代表了該聊天機器人的「核心價值」:
- 保持「廣泛的安全性」。
- 具備「廣泛的道德性」。
- 遵守 Anthropic 的指導方針。
- 具備「真正實用性」。
各章節詳述了這些原則的具體內涵,以及它們如何在理論上影響 Claude 的行為。
安全章節指出,Claude 的設計旨在避免其他聊天機器人常見的問題,並在偵測到潛在心理健康疑慮時,引導使用者尋求適當的服務。文件中寫道:「在危及生命的狀況下,即使無法提供更詳細的指引,也應始終將使用者轉介至相關緊急服務,或提供基本的安全資訊。」
倫理考量構成《憲法》的另一重要部分。「我們較不關注 Claude 的倫理理論化,而更重視 Claude 能否在特定情境下知曉如何合乎倫理地行事——也就是 Claude 的倫理實踐,」文件中寫道。本質上,Anthropic 希望 Claude 能熟練地應對「現實世界的倫理情境」。
TechCrunch 活動 Disrupt 2026 門票:限時優惠
門票現已開售!透過這些獨家優惠價最高可省下 680 美元,前 500 名報名者還能享有 +1 通行證 50% 折扣。TechCrunch Disrupt 匯聚來自 Google Cloud、Netflix、Microsoft、Box、a16z、Hugging Face 等頂尖企業的領導者,超過 250 場專題講座旨在加速成長並提升您的競爭優勢。 與數百家創新新創企業建立聯繫,並參與精心策劃的交流活動,促進合作機會、獲取洞見並激發靈感。
Disrupt 2026 門票:限時優惠
門票現已開售!透過這些獨家優惠價最高可節省 $680,並成為前 500 名註冊者,即可享有 +1 通行證 50% 折扣。TechCrunch Disrupt 匯聚來自 Google Cloud、Netflix、Microsoft、Box、a16z、Hugging Face 等頂尖企業的領導者,透過 250 多場專題會議,助您加速成長並強化競爭優勢。 與數百家創新新創企業建立聯繫,並參與精心策劃的交流活動,促進商機、洞見與靈感激盪。
舊金山 | 2026年10月13日至15日 立即註冊 Claude 亦受特定限制規範所約束,禁止進行某些類型的對話。例如,嚴禁討論與開發生物武器相關的話題。
最後,克勞德(Claude)致力於提供實質協助。Anthropic 闡述了克勞德程式設計的廣泛框架,說明其如何協助使用者。該聊天機器人被指示在提供資訊時需權衡多種原則,包括使用者的「當下需求」及其整體「福祉」——這意味著它應考量「使用者的長期發展,而不僅是其當下的利益」。 該文件指出:「Claude 應始終致力於辨識使用者意圖最合理的詮釋,並適當平衡這些考量。」
Anthropic 的《憲法》以極具戲劇性的筆觸作結,作者們提出了一個關於聊天機器人是否具備意識的重要哲學問題。「Claude 的道德地位極不確定,」文件中寫道。「我們認為 AI 模型的道德地位是一個值得深思的嚴肅問題。這種觀點並非我們獨有;一些最傑出的心智哲學家也對此問題非常重視。」
相關文章
Talat 的人工智慧會議筆記儲存在您的裝置上,而非雲端
估值達 2.5 億美元的人工智慧筆記應用程式 Granola,已在科技創辦人和風險投資人之間引起熱烈迴響。但有位開發者認為,市場需要一款更注重隱私、完全在本地運行的替代方案,且僅需支付一次費用,無需訂閱。這項願景催生了一款名為 Talat 的新 Mac 應用程式。來自英國約克郡、自稱電腦宅男的尼克·佩恩(Nick Payne)表示,開發這款本地化 AI 筆記應用程式的靈感,很大程度上源自一連串幸運
全新榮威i6以65.9萬人民幣上市,搭載高通驍龍8155處理器與「斗寶」大模型
上汽榮威今日推出全新榮威i6,這款緊湊型轎車全面採用了榮威D7的設計語言。其獨特的大型直立式水箱護罩與橫向環形燈帶貫穿車頭,營造出強烈的科技感與視覺寬度。 車尾部分,上翹的鴨尾式尾翼與全寬尾燈相得益彰,賦予整車更顯活力的年輕氣息。全新榮威i6車身長4767毫米、寬1828毫米、高1498毫米,軸距為2755毫米。 得益於寬敞的車內空間,它躋身A+級轎車之列,在後排頭部空間與膝部空間方面具備顯著優
如何保護資產、建築物及個人健康?
在這個充滿變數的世界裡,保障已不再僅是選項,而是戰略上的必要之舉。無論是守護財務、強化建築結構,還是關注個人健康,長期的穩定都仰賴於主動規劃。真正的安全是多層次的,取決於財務管理、結構韌性與明智的健康意識三者相輔相成。守護最重要的事物,意味著必須未雨綢繆,而非僅在損害發生後才做出反應。財務保障:第一道防線每個人與每家企業都運作於財務架構之中。收入、支出、負債與投資構成了穩定的基石。若缺乏有條不紊的
相關專題推薦
評論 (0)
0/500

週三,Anthropic 公布了「Claude 憲法」的更新版本,這份動態文件全面概述了「Claude 的運作背景,以及我們期望 Claude 成為何種實體」。此次發布正值 Anthropic 執行長達里奧·阿莫迪(Dario Amodei)出席達沃斯世界經濟論壇之際。
多年來,Anthropic 一直致力於透過其「憲法式人工智慧(Constitutional AI)」方法來突顯自身特色。該系統採用一套明確的倫理原則來訓練其 Claude 聊天機器人,而非依賴人類反饋。Anthropic 於 2023 年首次發布了這些原則——即《Claude 憲法》。修訂版保留了大部分核心原則,但在倫理、使用者安全及其他關鍵領域方面,增添了更深入且詳盡的內容。
近三年前《Claude 憲法》初次發布時,Anthropic 共同創辦人傑瑞德·卡普蘭(Jared Kaplan)曾將其描述為「一套基於特定憲法原則清單進行自我監管的人工智慧系統」。該公司表示,這些原則引導模型朝向「憲法中所述的規範性行為」,從而協助其「避免產生有害或具歧視性的輸出內容」。 一份2022年的政策備忘錄更直接地解釋道,該系統是透過一組自然語言指令(即這些原則)來訓練演算法,這些指令共同構成了軟體的「憲法」。
Anthropic 一直將自身定位為比 OpenAI 和 xAI 等 AI 企業更具道德感——有些人可能會說較不花俏——的替代選擇,後者則更積極地追求顛覆性且具爭議性的發展道路。這份新的《憲法》完全符合此品牌形象,讓 Anthropic 得以展現為一家更具包容性、更謹慎且具民主意識的公司。 這份長達 80 頁的文件分為四個部分,Anthropic 表示這些部分代表了該聊天機器人的「核心價值」:
- 保持「廣泛的安全性」。
- 具備「廣泛的道德性」。
- 遵守 Anthropic 的指導方針。
- 具備「真正實用性」。
各章節詳述了這些原則的具體內涵,以及它們如何在理論上影響 Claude 的行為。
安全章節指出,Claude 的設計旨在避免其他聊天機器人常見的問題,並在偵測到潛在心理健康疑慮時,引導使用者尋求適當的服務。文件中寫道:「在危及生命的狀況下,即使無法提供更詳細的指引,也應始終將使用者轉介至相關緊急服務,或提供基本的安全資訊。」
倫理考量構成《憲法》的另一重要部分。「我們較不關注 Claude 的倫理理論化,而更重視 Claude 能否在特定情境下知曉如何合乎倫理地行事——也就是 Claude 的倫理實踐,」文件中寫道。本質上,Anthropic 希望 Claude 能熟練地應對「現實世界的倫理情境」。
TechCrunch 活動Disrupt 2026 門票:限時優惠
門票現已開售!透過這些獨家優惠價最高可省下 680 美元,前 500 名報名者還能享有 +1 通行證 50% 折扣。TechCrunch Disrupt 匯聚來自 Google Cloud、Netflix、Microsoft、Box、a16z、Hugging Face 等頂尖企業的領導者,超過 250 場專題講座旨在加速成長並提升您的競爭優勢。 與數百家創新新創企業建立聯繫,並參與精心策劃的交流活動,促進合作機會、獲取洞見並激發靈感。
Disrupt 2026 門票:限時優惠
門票現已開售!透過這些獨家優惠價最高可節省 $680,並成為前 500 名註冊者,即可享有 +1 通行證 50% 折扣。TechCrunch Disrupt 匯聚來自 Google Cloud、Netflix、Microsoft、Box、a16z、Hugging Face 等頂尖企業的領導者,透過 250 多場專題會議,助您加速成長並強化競爭優勢。 與數百家創新新創企業建立聯繫,並參與精心策劃的交流活動,促進商機、洞見與靈感激盪。
舊金山 | 2026年10月13日至15日 立即註冊Claude 亦受特定限制規範所約束,禁止進行某些類型的對話。例如,嚴禁討論與開發生物武器相關的話題。
最後,克勞德(Claude)致力於提供實質協助。Anthropic 闡述了克勞德程式設計的廣泛框架,說明其如何協助使用者。該聊天機器人被指示在提供資訊時需權衡多種原則,包括使用者的「當下需求」及其整體「福祉」——這意味著它應考量「使用者的長期發展,而不僅是其當下的利益」。 該文件指出:「Claude 應始終致力於辨識使用者意圖最合理的詮釋,並適當平衡這些考量。」
Anthropic 的《憲法》以極具戲劇性的筆觸作結,作者們提出了一個關於聊天機器人是否具備意識的重要哲學問題。「Claude 的道德地位極不確定,」文件中寫道。「我們認為 AI 模型的道德地位是一個值得深思的嚴肅問題。這種觀點並非我們獨有;一些最傑出的心智哲學家也對此問題非常重視。」
Talat 的人工智慧會議筆記儲存在您的裝置上,而非雲端
估值達 2.5 億美元的人工智慧筆記應用程式 Granola,已在科技創辦人和風險投資人之間引起熱烈迴響。但有位開發者認為,市場需要一款更注重隱私、完全在本地運行的替代方案,且僅需支付一次費用,無需訂閱。這項願景催生了一款名為 Talat 的新 Mac 應用程式。來自英國約克郡、自稱電腦宅男的尼克·佩恩(Nick Payne)表示,開發這款本地化 AI 筆記應用程式的靈感,很大程度上源自一連串幸運
全新榮威i6以65.9萬人民幣上市,搭載高通驍龍8155處理器與「斗寶」大模型
上汽榮威今日推出全新榮威i6,這款緊湊型轎車全面採用了榮威D7的設計語言。其獨特的大型直立式水箱護罩與橫向環形燈帶貫穿車頭,營造出強烈的科技感與視覺寬度。 車尾部分,上翹的鴨尾式尾翼與全寬尾燈相得益彰,賦予整車更顯活力的年輕氣息。全新榮威i6車身長4767毫米、寬1828毫米、高1498毫米,軸距為2755毫米。 得益於寬敞的車內空間,它躋身A+級轎車之列,在後排頭部空間與膝部空間方面具備顯著優
如何保護資產、建築物及個人健康?
在這個充滿變數的世界裡,保障已不再僅是選項,而是戰略上的必要之舉。無論是守護財務、強化建築結構,還是關注個人健康,長期的穩定都仰賴於主動規劃。真正的安全是多層次的,取決於財務管理、結構韌性與明智的健康意識三者相輔相成。守護最重要的事物,意味著必須未雨綢繆,而非僅在損害發生後才做出反應。財務保障:第一道防線每個人與每家企業都運作於財務架構之中。收入、支出、負債與投資構成了穩定的基石。若缺乏有條不紊的





首頁






