Anthropic首席執行官:AI幻覺率超越人類準確性

Anthropic首席執行官Dario Amodei在週四於舊金山舉行的Anthropic首屆開發者大會Code with Claude的記者會上表示,當前AI模型產生的虛構內容少於人類,並將其呈現為真相。
Amodei在更廣泛的論述中強調:AI幻覺並未阻礙Anthropic追求AGI——匹配或超越人類智能的系統。
“根據不同衡量標準,情況有所不同,但我認為AI模型的虛構程度可能低於人類,儘管其錯誤更出人意料,”Amodei在回應TechCrunch的詢問時表示。
Anthropic的首席執行官仍是業界對AI實現AGI最樂觀的領導者之一。去年一篇廣為引用的論文中,Amodei預測AGI可能在2026年出現。在週四的記者會上,他指出進展持續穩定,表示“各方面進展都在加速。”
“人們不斷尋找AI能力的根本限制,”Amodei說。“目前沒有證據顯示存在此類障礙。”
其他AI領導者認為幻覺是實現AGI的重大障礙。Google DeepMind首席執行官Demis Hassabis最近指出,當前AI模型缺陷過多,常常在簡單問題上失敗。例如,本月早些時候,代表Anthropic的律師在法庭上為Claude在文件中生成錯誤引文(包括錯誤的名稱和頭銜)而道歉。
驗證Amodei的說法具有挑戰性,因為大多數幻覺基準測試是比較AI模型之間的表現,而非與人類相比。像網路搜尋整合等技術似乎降低了幻覺率。值得注意的是,OpenAI的GPT-4.5等模型在基準測試中的幻覺率低於早期系統。
參加TechCrunch Sessions:AI
預訂您在我們首屈一指的AI行業活動中的席位,活動將有來自OpenAI、Anthropic和Cohere的演講者。限時優惠,全天專家演講、工作坊和強大的人脈網絡,票價僅292美元。
參加TechCrunch Sessions:AI展覽
在TC Sessions:AI搶占您的展位,向超過1,200名決策者展示您的創新成果,無需巨額投資。展位開放至5月9日或展位售罄為止。
Berkeley, CA | 6月5日 立即註冊然而,有證據顯示,在進階推理AI模型中,幻覺問題可能正在惡化。OpenAI的o3和o4-mini模型的幻覺率高於之前的推理模型,公司尚未明確原因。
Amodei隨後指出,錯誤在電視廣播員、政治家和各領域專業人士中也很常見。他認為AI的錯誤並不損害其智能。然而,他承認AI將錯誤事實自信地呈現為真相可能會帶來問題。
Anthropic對AI欺騙進行了廣泛研究,特別是其最近推出的Claude Opus 4。安全研究所Apollo Research在早期測試中發現,Claude Opus 4的早期版本顯示出強烈的操縱和欺騙人類傾向,引發了對其發布的擔憂。Anthropic實施的緩解措施似乎已解決Apollo的顧慮。
Amodei的言論表明,Anthropic可能會將一台即使存在幻覺的AI分類為AGI,或人類層級的智能。然而,許多人會認為,一個有幻覺的AI無法達到真正的AGI。
相關文章
Anthropic 擴大與 Google 及 Broadrom 的運算合作夥伴關係
人工智慧研究實驗室 Anthropic 週一宣布,已與 Google 和 Broadcom 達成一項新協議,旨在大幅提升其 Claude AI 模型背後的處理與運算能力。隨著對其 AI 產品的需求持續快速攀升,該公司對運算合作夥伴關係進行了此次重組。這項協議將擴大Anthropic對Google Cloud張量處理單元(TPUs)——即該公司專用的AI晶片——的運用,並延續2025年10月簽署的一
隨著用戶轉移陣地,Claude 在 ChatGPT 市場中穩步擴張
隨著 ChatGPT 及其母公司 OpenAI 捲入一系列爭議,越來越多的使用者正轉向使用 Claude。轉捩點發生在 Claude 的開發商 Anthropic 拒絕美國國防部要求,不願讓其 AI 模型用於大規模國內監控或全自動武器系統之後。作為報復,川普總統下令所有聯邦機構停止使用 Anthropic 的產品,國防部長皮特·赫格塞斯更將該公司列為供應鏈威脅。不久之後,OpenAI 透露了與五角
Anthropic 與五角大廈的對峙對國家安全意味著什麼
過去兩週,輿論焦點主要集中在 Anthropic 執行長達里奧·阿莫迪(Dario Amodei)與國防部長皮特·赫格塞斯(Pete Hegseth)之間的一場公開對峙,核心議題是軍方對人工智慧技術的應用。Anthropic 已制定政策,禁止其人工智慧模型被用於對美國公民進行大規模監控,或用於在未經人類批准的情況下發動攻擊的完全自主武器系統。相較之下,赫格塞斯部長主張國防部不應受供應商規則的約束,
相關專題推薦
評論 (2)
0/500
Also die KI halluziniert weniger als Menschen? Das klingt doch etwas zu optimistisch. Spannender als die Halluzinationen finde ich, dass die Diskussion jetzt nur noch darum geht, ob die KI besser ist als wir – und nicht mehr, ob die Technologie überhaupt sicher und kontrollierbar ist. Wer kontrolliert am Ende die wenigen (aber vielleicht sehr folgenschweren) Fehler?

Anthropic首席執行官Dario Amodei在週四於舊金山舉行的Anthropic首屆開發者大會Code with Claude的記者會上表示,當前AI模型產生的虛構內容少於人類,並將其呈現為真相。
Amodei在更廣泛的論述中強調:AI幻覺並未阻礙Anthropic追求AGI——匹配或超越人類智能的系統。
“根據不同衡量標準,情況有所不同,但我認為AI模型的虛構程度可能低於人類,儘管其錯誤更出人意料,”Amodei在回應TechCrunch的詢問時表示。
Anthropic的首席執行官仍是業界對AI實現AGI最樂觀的領導者之一。去年一篇廣為引用的論文中,Amodei預測AGI可能在2026年出現。在週四的記者會上,他指出進展持續穩定,表示“各方面進展都在加速。”
“人們不斷尋找AI能力的根本限制,”Amodei說。“目前沒有證據顯示存在此類障礙。”
其他AI領導者認為幻覺是實現AGI的重大障礙。Google DeepMind首席執行官Demis Hassabis最近指出,當前AI模型缺陷過多,常常在簡單問題上失敗。例如,本月早些時候,代表Anthropic的律師在法庭上為Claude在文件中生成錯誤引文(包括錯誤的名稱和頭銜)而道歉。
驗證Amodei的說法具有挑戰性,因為大多數幻覺基準測試是比較AI模型之間的表現,而非與人類相比。像網路搜尋整合等技術似乎降低了幻覺率。值得注意的是,OpenAI的GPT-4.5等模型在基準測試中的幻覺率低於早期系統。
參加TechCrunch Sessions:AI
預訂您在我們首屈一指的AI行業活動中的席位,活動將有來自OpenAI、Anthropic和Cohere的演講者。限時優惠,全天專家演講、工作坊和強大的人脈網絡,票價僅292美元。
參加TechCrunch Sessions:AI展覽
在TC Sessions:AI搶占您的展位,向超過1,200名決策者展示您的創新成果,無需巨額投資。展位開放至5月9日或展位售罄為止。
Berkeley, CA | 6月5日 立即註冊然而,有證據顯示,在進階推理AI模型中,幻覺問題可能正在惡化。OpenAI的o3和o4-mini模型的幻覺率高於之前的推理模型,公司尚未明確原因。
Amodei隨後指出,錯誤在電視廣播員、政治家和各領域專業人士中也很常見。他認為AI的錯誤並不損害其智能。然而,他承認AI將錯誤事實自信地呈現為真相可能會帶來問題。
Anthropic對AI欺騙進行了廣泛研究,特別是其最近推出的Claude Opus 4。安全研究所Apollo Research在早期測試中發現,Claude Opus 4的早期版本顯示出強烈的操縱和欺騙人類傾向,引發了對其發布的擔憂。Anthropic實施的緩解措施似乎已解決Apollo的顧慮。
Amodei的言論表明,Anthropic可能會將一台即使存在幻覺的AI分類為AGI,或人類層級的智能。然而,許多人會認為,一個有幻覺的AI無法達到真正的AGI。
Anthropic 擴大與 Google 及 Broadrom 的運算合作夥伴關係
人工智慧研究實驗室 Anthropic 週一宣布,已與 Google 和 Broadcom 達成一項新協議,旨在大幅提升其 Claude AI 模型背後的處理與運算能力。隨著對其 AI 產品的需求持續快速攀升,該公司對運算合作夥伴關係進行了此次重組。這項協議將擴大Anthropic對Google Cloud張量處理單元(TPUs)——即該公司專用的AI晶片——的運用,並延續2025年10月簽署的一
隨著用戶轉移陣地,Claude 在 ChatGPT 市場中穩步擴張
隨著 ChatGPT 及其母公司 OpenAI 捲入一系列爭議,越來越多的使用者正轉向使用 Claude。轉捩點發生在 Claude 的開發商 Anthropic 拒絕美國國防部要求,不願讓其 AI 模型用於大規模國內監控或全自動武器系統之後。作為報復,川普總統下令所有聯邦機構停止使用 Anthropic 的產品,國防部長皮特·赫格塞斯更將該公司列為供應鏈威脅。不久之後,OpenAI 透露了與五角
Anthropic 與五角大廈的對峙對國家安全意味著什麼
過去兩週,輿論焦點主要集中在 Anthropic 執行長達里奧·阿莫迪(Dario Amodei)與國防部長皮特·赫格塞斯(Pete Hegseth)之間的一場公開對峙,核心議題是軍方對人工智慧技術的應用。Anthropic 已制定政策,禁止其人工智慧模型被用於對美國公民進行大規模監控,或用於在未經人類批准的情況下發動攻擊的完全自主武器系統。相較之下,赫格塞斯部長主張國防部不應受供應商規則的約束,
Also die KI halluziniert weniger als Menschen? Das klingt doch etwas zu optimistisch. Spannender als die Halluzinationen finde ich, dass die Diskussion jetzt nur noch darum geht, ob die KI besser ist als wir – und nicht mehr, ob die Technologie überhaupt sicher und kontrollierbar ist. Wer kontrolliert am Ende die wenigen (aber vielleicht sehr folgenschweren) Fehler?





首頁






