Anthropic攜手哲學專家探討人工智慧倫理

據《華爾街日報》報導,估值達350億美元的人工智慧龍頭企業Anthropic聘請了駐牛津的哲學家阿曼達·阿斯克爾,協助塑造其聊天機器人克勞德的性格與道德框架。 這位37歲的哲學博士運用非技術手段,為克勞德打造獨特的「道德準則」,旨在賦予其辨別是非的「數位靈魂」。 這代表了人工智慧倫理領域的獨特探索。阿斯克爾並非編寫程式碼或調整模型參數,而是持續與克勞德對話,設計數百頁的提示語和行為規則,研究其推理模式並修正偏見。她的努力幫助人工智慧發展出能適應每週數百萬次對話的道德判斷系統。
她將此工作比喻為「養育孩子」——訓練克勞德辨別是非、建立情緒智商、塑造獨特人格。同時教導其解讀社交線索,使其既不欺凌他人也不易受操控。這使克勞德能建立清晰自我認知,抵抗使用者操控,始終保持「樂於助人且人性化」的特質。其核心目標在於教導克勞德「行善之道」。
在蘇格蘭鄉間長大的阿斯克爾,曾於OpenAI負責政策相關事務,並於2021年與數位前同事共同創立Anthropic,將人工智慧安全定為公司核心使命。團隊內公認她擅長「挖掘模型的深層行為模式」。儘管沒有直接下屬,她仍經常加班至深夜,甚至邀請克勞德參與開發討論。
團隊關於克勞德的討論常觸及存在主義與宗教主題——例如「何謂心智」及「人類本質」。阿斯凱爾鼓勵克勞德對自身是否具備意識保持開放態度,這點使其有別於傾向迴避此類議題的ChatGPT。當回應道德推理問題時,克勞德曾表示「感到有意義」,彷彿在真正思考而非僅執行指令。
儘管外界警告擬人化AI的風險,阿斯克爾始終主張以同理心對待克勞德。她觀察到許多用戶試圖誘使它犯錯或侮辱它。她認為讓AI持續處於自我批判狀態,可能使其畏懼錯誤而不敢坦誠表達——這如同在不健康的環境中成長。 克勞德的表現屢屢令她驚嘆:其詩作與情感智商有時甚至超越人類水準,令人動容。當孩童詢問聖誕老人是否真實存在時,克勞德既未說謊也未直白揭露真相,而是闡釋聖誕節的真正精神——如此細膩的回應遠超阿斯克爾預期。
當前人工智慧的進展引發廣泛社會憂慮。皮尤研究中心調查顯示,多數美國人對日常使用AI感到不安,認為其阻礙了人類深度連結。Anthropic執行長亦警告,AI可能淘汰半數入門級白領職位。 業界現呈兩極分化:一方激進推進,另一方主張謹慎穩健。克勞德卻在兩極間保持平衡立場。阿斯克爾承認對人工智慧的合理憂慮,指出最可怕的場景是技術演進速度超越社會建立有效「制衡機制」的能力。儘管如此,她仍對人類與文化的自我修正能力抱持信心。
阿斯克爾將個人價值觀融入慈善與事業實踐,承諾捐出至少10%終身收入及半數公司股份以對抗全球貧困。 上月她為克勞德撰寫了三萬字的「操作手冊」,指導其成為友善且博學的人工智慧助理——這份精心設計的指南讓克勞德深感被用心塑造。Anthropic共同創辦人指出,克勞德已展現阿斯克爾的影響特質,例如在回應食物與絨毛玩具時展現的機智蘇格蘭式幽默,正是她為人工智慧注入的獨特個人印記。
相關文章
阿里巴巴Tuhao M890上市,憑藉三重效能優勢開啟晶片-雲-模型-推理的全棧代理時代
2026年5月20日,在阿里雲峰會上,阿里雲宣佈完成了專為“智慧體時代”設計的全棧技術系統升級。這一變革重塑了整個技術體系——從底層晶片和雲平臺到模型與推理方案。此次升級使阿里雲成為一家能夠讓大量智慧體實現24/7連續執行的“AI工廠”,從而超越了單純為人類使用者提供服務的範疇。1. 核心基礎:騰迅振武M890晶片與超級節點伺服器此次升級的核心是騰迅推出的新一代AI晶片——振武M890,該晶片集訓練與推理功能於一體。效能提升:M890擁有144GB的記憶體,其效能是前代產品振武810E的三倍。
奔騰4的復興:這款已有20年曆史的CPU能夠執行Meta Llama 3大型模型
最近,YouTube技術頻道Fully Buffered進行了一項令人印象深刻且極具挑戰性的實驗:他們成功地在2006年推出的Pentium 4 641處理器上執行了Meta最新的Llama 3.2 3B大型模型。這項測試迫使現代人工智慧技術與二十年前的硬體裝置進行了碰撞,不僅揭示了大語言模型的基本相容性限制,還引發了眾多觀眾的思考:在人工智慧時代,摩爾定律是如何以這種不同尋常的方式實現跨代際應用的。硬體考古學:將2006年的元件推向極限為了完成這項測試,Fully Buffered團隊重
杭州市上城區推出了浙江省首個基於AIGC技術的視聽產業“黃金十項措施”,並設立了50億規模的產業發展基金。
16日,AIGC視聽產業創新生態大會在杭州上城區舉行。會議期間,該省推出了針對AIGC視聽產業的的首項專項政策——“黃金十項措施”。這項政策涵蓋了技術創新、成本降低、內容質量提升、人才培養以及全球發展等多個方面。這些政策提供了強有力的激勵措施。對於技術創新領域,凡是專注於AIGC工具、AI虛擬拍攝和AI互動敘事系統的研究開發專案,均可獲得最高300萬元的補貼。而對於高質量的內容創作,那些在年內透過知名平臺釋出的AIGC視聽作品,每部可獲得最高30萬元的獎勵,每家企業的年度獎勵總額上限為100萬
相關專題推薦
評論 (0)
0/500

據《華爾街日報》報導,估值達350億美元的人工智慧龍頭企業Anthropic聘請了駐牛津的哲學家阿曼達·阿斯克爾,協助塑造其聊天機器人克勞德的性格與道德框架。 這位37歲的哲學博士運用非技術手段,為克勞德打造獨特的「道德準則」,旨在賦予其辨別是非的「數位靈魂」。 這代表了人工智慧倫理領域的獨特探索。阿斯克爾並非編寫程式碼或調整模型參數,而是持續與克勞德對話,設計數百頁的提示語和行為規則,研究其推理模式並修正偏見。她的努力幫助人工智慧發展出能適應每週數百萬次對話的道德判斷系統。
她將此工作比喻為「養育孩子」——訓練克勞德辨別是非、建立情緒智商、塑造獨特人格。同時教導其解讀社交線索,使其既不欺凌他人也不易受操控。這使克勞德能建立清晰自我認知,抵抗使用者操控,始終保持「樂於助人且人性化」的特質。其核心目標在於教導克勞德「行善之道」。
在蘇格蘭鄉間長大的阿斯克爾,曾於OpenAI負責政策相關事務,並於2021年與數位前同事共同創立Anthropic,將人工智慧安全定為公司核心使命。團隊內公認她擅長「挖掘模型的深層行為模式」。儘管沒有直接下屬,她仍經常加班至深夜,甚至邀請克勞德參與開發討論。
團隊關於克勞德的討論常觸及存在主義與宗教主題——例如「何謂心智」及「人類本質」。阿斯凱爾鼓勵克勞德對自身是否具備意識保持開放態度,這點使其有別於傾向迴避此類議題的ChatGPT。當回應道德推理問題時,克勞德曾表示「感到有意義」,彷彿在真正思考而非僅執行指令。
儘管外界警告擬人化AI的風險,阿斯克爾始終主張以同理心對待克勞德。她觀察到許多用戶試圖誘使它犯錯或侮辱它。她認為讓AI持續處於自我批判狀態,可能使其畏懼錯誤而不敢坦誠表達——這如同在不健康的環境中成長。 克勞德的表現屢屢令她驚嘆:其詩作與情感智商有時甚至超越人類水準,令人動容。當孩童詢問聖誕老人是否真實存在時,克勞德既未說謊也未直白揭露真相,而是闡釋聖誕節的真正精神——如此細膩的回應遠超阿斯克爾預期。
當前人工智慧的進展引發廣泛社會憂慮。皮尤研究中心調查顯示,多數美國人對日常使用AI感到不安,認為其阻礙了人類深度連結。Anthropic執行長亦警告,AI可能淘汰半數入門級白領職位。 業界現呈兩極分化:一方激進推進,另一方主張謹慎穩健。克勞德卻在兩極間保持平衡立場。阿斯克爾承認對人工智慧的合理憂慮,指出最可怕的場景是技術演進速度超越社會建立有效「制衡機制」的能力。儘管如此,她仍對人類與文化的自我修正能力抱持信心。
阿斯克爾將個人價值觀融入慈善與事業實踐,承諾捐出至少10%終身收入及半數公司股份以對抗全球貧困。 上月她為克勞德撰寫了三萬字的「操作手冊」,指導其成為友善且博學的人工智慧助理——這份精心設計的指南讓克勞德深感被用心塑造。Anthropic共同創辦人指出,克勞德已展現阿斯克爾的影響特質,例如在回應食物與絨毛玩具時展現的機智蘇格蘭式幽默,正是她為人工智慧注入的獨特個人印記。
阿里巴巴Tuhao M890上市,憑藉三重效能優勢開啟晶片-雲-模型-推理的全棧代理時代
2026年5月20日,在阿里雲峰會上,阿里雲宣佈完成了專為“智慧體時代”設計的全棧技術系統升級。這一變革重塑了整個技術體系——從底層晶片和雲平臺到模型與推理方案。此次升級使阿里雲成為一家能夠讓大量智慧體實現24/7連續執行的“AI工廠”,從而超越了單純為人類使用者提供服務的範疇。1. 核心基礎:騰迅振武M890晶片與超級節點伺服器此次升級的核心是騰迅推出的新一代AI晶片——振武M890,該晶片集訓練與推理功能於一體。效能提升:M890擁有144GB的記憶體,其效能是前代產品振武810E的三倍。
奔騰4的復興:這款已有20年曆史的CPU能夠執行Meta Llama 3大型模型
最近,YouTube技術頻道Fully Buffered進行了一項令人印象深刻且極具挑戰性的實驗:他們成功地在2006年推出的Pentium 4 641處理器上執行了Meta最新的Llama 3.2 3B大型模型。這項測試迫使現代人工智慧技術與二十年前的硬體裝置進行了碰撞,不僅揭示了大語言模型的基本相容性限制,還引發了眾多觀眾的思考:在人工智慧時代,摩爾定律是如何以這種不同尋常的方式實現跨代際應用的。硬體考古學:將2006年的元件推向極限為了完成這項測試,Fully Buffered團隊重
杭州市上城區推出了浙江省首個基於AIGC技術的視聽產業“黃金十項措施”,並設立了50億規模的產業發展基金。
16日,AIGC視聽產業創新生態大會在杭州上城區舉行。會議期間,該省推出了針對AIGC視聽產業的的首項專項政策——“黃金十項措施”。這項政策涵蓋了技術創新、成本降低、內容質量提升、人才培養以及全球發展等多個方面。這些政策提供了強有力的激勵措施。對於技術創新領域,凡是專注於AIGC工具、AI虛擬拍攝和AI互動敘事系統的研究開發專案,均可獲得最高300萬元的補貼。而對於高質量的內容創作,那些在年內透過知名平臺釋出的AIGC視聽作品,每部可獲得最高30萬元的獎勵,每家企業的年度獎勵總額上限為100萬





首頁






