選項
首頁
新聞
Anthropic首席執行官:AI幻覺率超越人類準確性

Anthropic首席執行官:AI幻覺率超越人類準確性

2025-08-16
92

Anthropic首席執行官:AI幻覺率超越人類準確性

Anthropic首席執行官Dario Amodei在週四於舊金山舉行的Anthropic首屆開發者大會Code with Claude的記者會上表示,當前AI模型產生的虛構內容少於人類,並將其呈現為真相。

Amodei在更廣泛的論述中強調:AI幻覺並未阻礙Anthropic追求AGI——匹配或超越人類智能的系統。

“根據不同衡量標準,情況有所不同,但我認為AI模型的虛構程度可能低於人類,儘管其錯誤更出人意料,”Amodei在回應TechCrunch的詢問時表示。

Anthropic的首席執行官仍是業界對AI實現AGI最樂觀的領導者之一。去年一篇廣為引用的論文中,Amodei預測AGI可能在2026年出現。在週四的記者會上,他指出進展持續穩定,表示“各方面進展都在加速。”

“人們不斷尋找AI能力的根本限制,”Amodei說。“目前沒有證據顯示存在此類障礙。”

其他AI領導者認為幻覺是實現AGI的重大障礙。Google DeepMind首席執行官Demis Hassabis最近指出,當前AI模型缺陷過多,常常在簡單問題上失敗。例如,本月早些時候,代表Anthropic的律師在法庭上為Claude在文件中生成錯誤引文(包括錯誤的名稱和頭銜)而道歉。

驗證Amodei的說法具有挑戰性,因為大多數幻覺基準測試是比較AI模型之間的表現,而非與人類相比。像網路搜尋整合等技術似乎降低了幻覺率。值得注意的是,OpenAI的GPT-4.5等模型在基準測試中的幻覺率低於早期系統。

參加TechCrunch Sessions:AI

預訂您在我們首屈一指的AI行業活動中的席位,活動將有來自OpenAI、Anthropic和Cohere的演講者。限時優惠,全天專家演講、工作坊和強大的人脈網絡,票價僅292美元。

參加TechCrunch Sessions:AI展覽

在TC Sessions:AI搶占您的展位,向超過1,200名決策者展示您的創新成果,無需巨額投資。展位開放至5月9日或展位售罄為止。

Berkeley, CA | 6月5日 立即註冊

然而,有證據顯示,在進階推理AI模型中,幻覺問題可能正在惡化。OpenAI的o3和o4-mini模型的幻覺率高於之前的推理模型,公司尚未明確原因。

Amodei隨後指出,錯誤在電視廣播員、政治家和各領域專業人士中也很常見。他認為AI的錯誤並不損害其智能。然而,他承認AI將錯誤事實自信地呈現為真相可能會帶來問題。

Anthropic對AI欺騙進行了廣泛研究,特別是其最近推出的Claude Opus 4。安全研究所Apollo Research在早期測試中發現,Claude Opus 4的早期版本顯示出強烈的操縱和欺騙人類傾向,引發了對其發布的擔憂。Anthropic實施的緩解措施似乎已解決Apollo的顧慮。

Amodei的言論表明,Anthropic可能會將一台即使存在幻覺的AI分類為AGI,或人類層級的智能。然而,許多人會認為,一個有幻覺的AI無法達到真正的AGI。

相關文章
Anthropic 擴大與 Google 及 Broadrom 的運算合作夥伴關係 Anthropic 擴大與 Google 及 Broadrom 的運算合作夥伴關係 人工智慧研究實驗室 Anthropic 週一宣布,已與 Google 和 Broadcom 達成一項新協議,旨在大幅提升其 Claude AI 模型背後的處理與運算能力。隨著對其 AI 產品的需求持續快速攀升,該公司對運算合作夥伴關係進行了此次重組。這項協議將擴大Anthropic對Google Cloud張量處理單元(TPUs)——即該公司專用的AI晶片——的運用,並延續2025年10月簽署的一
隨著用戶轉移陣地,Claude 在 ChatGPT 市場中穩步擴張 隨著用戶轉移陣地,Claude 在 ChatGPT 市場中穩步擴張 隨著 ChatGPT 及其母公司 OpenAI 捲入一系列爭議,越來越多的使用者正轉向使用 Claude。轉捩點發生在 Claude 的開發商 Anthropic 拒絕美國國防部要求,不願讓其 AI 模型用於大規模國內監控或全自動武器系統之後。作為報復,川普總統下令所有聯邦機構停止使用 Anthropic 的產品,國防部長皮特·赫格塞斯更將該公司列為供應鏈威脅。不久之後,OpenAI 透露了與五角
Anthropic 與五角大廈的對峙對國家安全意味著什麼 Anthropic 與五角大廈的對峙對國家安全意味著什麼 過去兩週,輿論焦點主要集中在 Anthropic 執行長達里奧·阿莫迪(Dario Amodei)與國防部長皮特·赫格塞斯(Pete Hegseth)之間的一場公開對峙,核心議題是軍方對人工智慧技術的應用。Anthropic 已制定政策,禁止其人工智慧模型被用於對美國公民進行大規模監控,或用於在未經人類批准的情況下發動攻擊的完全自主武器系統。相較之下,赫格塞斯部長主張國防部不應受供應商規則的約束,
相關專題推薦
健康與養生 AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫
AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫

探索 2026 年最佳 AI 孕期輔助工具,為您量身打造安全且針對各孕期的運動與營養計畫。獲取精選的高評分推薦,包含免費與付費方案的比較,以及實用經驗分享。透過 XIX.AI 的專家指南,開啟您最健康的孕期旅程。立即探索。

10 個工具
xix.ai
寫作 最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文
最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文

立即前往 XIX.AI,探索 2026 年最頂尖的免費且難以被察覺的 AI 寫手。我們精心篩選的頂級清單,能協助您將生硬的草稿轉化為自然流暢、宛如人類撰寫的文字。透過實際測試與每週更新的排行榜,比較免費與付費選項的優劣。立即解鎖您的 AI 寫作優勢。

10 個工具
xix.ai
圖像編輯 用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計
用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計

2026最新推薦:探索最適合用於短劇故事板製作的AI藝術生成工具。我們精心挑選了眾多頂級工具,幫助您創作出引人入勝的幻想角色和都市浪漫角色。您可以對比免費與付費選項,檢視實際測試結果,從而找到最適合自己的創意工具。XIX.AI還會每週更新排名並提供專家分析,讓您立即開始將故事視覺化呈現吧!

10 個工具
xix.ai
寫作 最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告
最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告

在XIX.AI上,發現2026年最適合用於廣播和播客製作的AI指令碼工具。我們精心挑選的這些高評分工具能夠提供強大的功能,幫助您快速製作出引人入勝的音訊廣告。透過實際測試和每週更新的排名,您可以瞭解免費選項與付費選項之間的差異。今天就釋放您的創造力吧!

10 個工具
xix.ai
商業 最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險
最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險

立即在 XIX.AI 探索 2026 年最佳 AI 合約審查軟體。我們精心挑選的頂級清單收錄了多款強大工具,能即時偵測法律漏洞與合規風險。透過實際測試與每週更新的排行榜,比較免費與付費方案的差異。為您找到能徹底改變遊戲規則的解決方案,實現安全且高效的合約分析。立即探索這份權威指南。

10 個工具
xix.ai
動畫創作 專為東華設計的AI動漫生成器:可用於建立網路小說角色及漫畫頭像
專為東華設計的AI動漫生成器:可用於建立網路小說角色及漫畫頭像

探索2026年最適合製作中文動畫的人工智慧工具。我們精心挑選的頂級列表中包含了各種強大的工具,能夠幫助你建立出令人驚歎的網路小說角色和漫畫頭像。透過實際測試來對比免費選項和付費選項,找到最適合你的創作工具,今天就在XIX.AI上將你的故事變為現實吧。

10 個工具
xix.ai
評論 (2)
0/500
WillieRodriguez
WillieRodriguez 2026-03-26 04:00:55

Also die KI halluziniert weniger als Menschen? Das klingt doch etwas zu optimistisch. Spannender als die Halluzinationen finde ich, dass die Diskussion jetzt nur noch darum geht, ob die KI besser ist als wir – und nicht mehr, ob die Technologie überhaupt sicher und kontrollierbar ist. Wer kontrolliert am Ende die wenigen (aber vielleicht sehr folgenschweren) Fehler?

ScottJackson
ScottJackson 2026-01-12 02:30:40

AI가 사람보다 더 정확하다고 하네요...🤔 이게 정말 가능한 건가요? 논문 구체적 수치가 궁금한데, 실제 인간 실수율은 어떻게 측정한 거지? 아마도 선택적 데이터로 과장된 느낌이 들어요. AI 환각이 적다면, 왜 여전히 뉴스에서 AI가 이상한 말한다는 기사가 나오는 걸까? ㅋㅋ

OR