選項
首頁
新聞
Anthropic首席執行官:AI幻覺率超越人類準確性

Anthropic首席執行官:AI幻覺率超越人類準確性

2025-08-16
0

Anthropic首席執行官:AI幻覺率超越人類準確性

Anthropic首席執行官Dario Amodei在週四於舊金山舉行的Anthropic首屆開發者大會Code with Claude的記者會上表示,當前AI模型產生的虛構內容少於人類,並將其呈現為真相。

Amodei在更廣泛的論述中強調:AI幻覺並未阻礙Anthropic追求AGI——匹配或超越人類智能的系統。

“根據不同衡量標準,情況有所不同,但我認為AI模型的虛構程度可能低於人類,儘管其錯誤更出人意料,”Amodei在回應TechCrunch的詢問時表示。

Anthropic的首席執行官仍是業界對AI實現AGI最樂觀的領導者之一。去年一篇廣為引用的論文中,Amodei預測AGI可能在2026年出現。在週四的記者會上,他指出進展持續穩定,表示“各方面進展都在加速。”

“人們不斷尋找AI能力的根本限制,”Amodei說。“目前沒有證據顯示存在此類障礙。”

其他AI領導者認為幻覺是實現AGI的重大障礙。Google DeepMind首席執行官Demis Hassabis最近指出,當前AI模型缺陷過多,常常在簡單問題上失敗。例如,本月早些時候,代表Anthropic的律師在法庭上為Claude在文件中生成錯誤引文(包括錯誤的名稱和頭銜)而道歉。

驗證Amodei的說法具有挑戰性,因為大多數幻覺基準測試是比較AI模型之間的表現,而非與人類相比。像網路搜尋整合等技術似乎降低了幻覺率。值得注意的是,OpenAI的GPT-4.5等模型在基準測試中的幻覺率低於早期系統。

參加TechCrunch Sessions:AI

預訂您在我們首屈一指的AI行業活動中的席位,活動將有來自OpenAI、Anthropic和Cohere的演講者。限時優惠,全天專家演講、工作坊和強大的人脈網絡,票價僅292美元。

參加TechCrunch Sessions:AI展覽

在TC Sessions:AI搶占您的展位,向超過1,200名決策者展示您的創新成果,無需巨額投資。展位開放至5月9日或展位售罄為止。

Berkeley, CA | 6月5日 立即註冊

然而,有證據顯示,在進階推理AI模型中,幻覺問題可能正在惡化。OpenAI的o3和o4-mini模型的幻覺率高於之前的推理模型,公司尚未明確原因。

Amodei隨後指出,錯誤在電視廣播員、政治家和各領域專業人士中也很常見。他認為AI的錯誤並不損害其智能。然而,他承認AI將錯誤事實自信地呈現為真相可能會帶來問題。

Anthropic對AI欺騙進行了廣泛研究,特別是其最近推出的Claude Opus 4。安全研究所Apollo Research在早期測試中發現,Claude Opus 4的早期版本顯示出強烈的操縱和欺騙人類傾向,引發了對其發布的擔憂。Anthropic實施的緩解措施似乎已解決Apollo的顧慮。

Amodei的言論表明,Anthropic可能會將一台即使存在幻覺的AI分類為AGI,或人類層級的智能。然而,許多人會認為,一個有幻覺的AI無法達到真正的AGI。

相關文章
萬事達卡的Agent Pay增強AI搜尋與無縫交易 萬事達卡的Agent Pay增強AI搜尋與無縫交易 傳統搜尋平台和AI代理通常要求使用者在找到產品或服務後切換視窗以完成購買。萬事達卡通過將其支付網絡嵌入AI平台,正在革新這一流程,使交易能在同一生態系統內順暢進行。該公司推出了Agent Pay計畫,將萬事達卡的支付系統整合進AI聊天平台。在接受VentureBeat採訪時,萬事達卡首席數據與AI官員Greg Ulrich表示,Agent Pay「完成了代理搜尋的循環」。「我們的目標是通過在平台內
AI驅動的零售實驗在Anthropic慘敗 AI驅動的零售實驗在Anthropic慘敗 想像一下,將一家小商店交給人工智慧,委託它處理從定價到客戶互動的一切。會出什麼問題呢?Anthropic最近的一項研究於週五發布,回答了這個問題:幾乎所有事情都出了問題。他們的AI助手Claude在舊金山辦公室經營了一個月的小商店,結果就像是為商學院學生寫下的警示故事,由一個毫無現實經驗的人撰寫——在這次實驗中,確實如此。Anthropic辦公室的「商店」是一個裝滿飲料和零食的小冰箱,搭配一個用於
Anthropic增強Claude以實現無縫工具整合與進階研究 Anthropic增強Claude以實現無縫工具整合與進階研究 Anthropic為Claude推出了全新的「整合」功能,使AI能直接與您偏好的工作工具連接。該公司還介紹了升級版的「進階研究」功能,以提供更深入的見解。整合功能簡化了Anthropic去年推出的技術標準「模型上下文協議」(Model Context Protocol, MCP),使其更加易於使用。原本複雜且僅限本地的功能,現在允許開發者為Claude創建安全連接,以與網頁或桌面應用程式互動。對C
評論 (0)
0/200
回到頂部
OR