選項
首頁
新聞
美中人工智慧競逐差距縮小,但對「負責任的人工智慧」的看法仍存分歧

美中人工智慧競逐差距縮小,但對「負責任的人工智慧」的看法仍存分歧

2026-05-08
72

數據並未強力支持「美國在人工智慧模型表現方面將長期保持領先」的假設,這只是史丹佛大學本週發布的《2026 年人工智慧指數報告》中眾多發人深省的結論之一。

這份由史丹佛大學以人為本人工智慧研究所發布、長達423頁的年度報告,對人工智慧領域進行了全面評估。報告檢視了研究成果、模型能力、投資趨勢、公眾輿論以及負責任的人工智慧實踐,揭示了數項引人注目的主要發現。

然而,最具深度的洞見其實隱藏在較少被關注的章節中,特別是關於人工智慧安全的部分——在該領域,模型能力與嚴謹危害評估之間的差距非但未縮小,反而愈發擴大。

儘管如此,仍有三項關鍵發現值得更多關注。

美中模型性能差距已實質上消失

關於美國在人工智慧發展中明顯領先的論述需要修正。報告指出,自2025年初以來,中美模型的頂尖表現排名已多次交替。2025年2月,DeepSeek-R1曾短暫追平領先的美國模型。截至2026年3月,Anthropic的頂尖模型僅以2.7%的微弱優勢領先。

美國仍開發出更多頂級AI模型——2025年為50個,相較於中國的30個——且持有影響力更高的專利。然而,中國目前在論文發表量、被引用份額以及獲准專利數量方面均處於領先地位。 中國在AI領域被引用次數前100名的論文中所佔比例,從2021年的33篇增長至2024年的41篇。值得注意的是,韓國在人均AI專利數量方面位居全球首位。

實際的啟示是,關於美國在AI模型性能方面能長期保持技術領先的假設,缺乏強有力的數據支持。與兩年前相比,兩國之間的差距已縮小至僅有微弱差距,且會隨著每個主要模型的發布而波動。

該報告還指出另一項結構性弱點。儘管美國擁有5,427座資料中心——數量是其他任何國家的十倍以上——但其中幾乎所有頂尖AI晶片,皆由單一企業台積電(TSMC)製造。儘管台積電於2025年在美國的擴建廠區已開始運作,但全球AI硬體供應鏈仍完全依賴台灣這家晶圓代工廠。

AI 安全基準測試進展遲緩,數據已證實此點

儘管幾乎所有前沿模型開發者都會報告能力基準測試的結果,但在負責任的AI基準測試方面卻並非如此。《2026年指數》精確記錄了這種差距。

報告中的安全與負責任人工智慧基準測試表格顯示,多數欄位僅是空白。僅有 Claude Opus 4.5 針對超過兩項追蹤中的負責任人工智慧基準測試報告了結果。僅有 GPT-5.2 針對 StrongREJECT 報告了結果。在衡量公平性、安全性及人類自主性的各項基準測試中,多數前沿模型均未報告任何數據。

各前沿模型在能力基準測試的報告上均一致。涵蓋安全、公平性與事實性的負責任AI基準測試,則大多缺席。來源:史丹佛大學HAI 2026 AI指數報告

這並不意味著前沿實驗室忽視了內部安全工作。報告承認持續進行紅隊測試與對齊測試,但指出「這些努力極少透過一套共通且可供外部比較的基準來公開」。因此,對於大多數模型而言,對 AI 安全特性的外部比較實際上是不可能的。

根據 AI 事件資料庫(AI Incident Database)的數據,2025 年記錄在案的 AI 事件增至 362 起,高於 2024 年的 233 起。經合組織(OECD)的「AI 事件與危害監測」(AI Incidents and Hazards Monitor)採用更廣泛的自動化監測管道,記錄到 2026 年 1 月單月事件數達到 435 起的峰值,六個月移動平均值為 326 起。

2025年記錄在案的人工智慧事件增至362起,高於前一年的233起,且在2022年之前,每年事件數均低於100起。資料來源:人工智慧事件資料庫(AIID),經由史丹佛大學HAI 2026年人工智慧指數報告

組織治理正苦於難以跟上這股趨勢。AI Index 與麥肯錫(McKinsey)的聯合調查發現,將自身 AI 事件應對評為「優秀」的組織比例,從 2024 年的 28% 降至 2025 年的 18%。評為「良好」的組織比例也從 39% 降至 24%。 與此同時,遭遇三至五起事件的組織比例則從30%上升至50%。

該報告還指出,在推動負責任的人工智慧發展方面存在結構性挑戰:某個領域的進步往往是以犧牲另一個領域為代價。例如,提升安全性可能會降低準確性,或改善隱私保護可能會削弱公平性。目前尚無既定的框架來管理這些權衡取捨,且在包括公平性與可解釋性在內的多個維度上,仍缺乏用於追蹤長期進展所需的標準化數據。

公眾焦慮隨採用率上升而加劇,凸顯專家與公眾間的認知落差

全球範圍內,59%的受訪者認為AI的益處大於弊端,較2024年的55%有所上升。與此同時,52%的受訪者表示AI產品與服務令他們感到不安,一年內上升了兩個百分點。這兩項數據同步上升,反映出公眾在更多使用AI的同時,對其發展軌跡也愈發感到不確定。

專家與大眾在AI對就業影響的看法上,分歧尤為明顯。根據報告,73%的AI專家預期AI將對人們的工作方式產生正面影響,而一般大眾中僅有23%持相同看法——兩者差距達50個百分點。在經濟層面,差距則為48個百分點(69%的專家持樂觀態度,相較於21%的大眾)。 在醫療照護方面,專家群體的樂觀程度遠高於大眾,達84%,而大眾僅有44%。

這些差距至關重要,因為公眾信任會影響監管結果,進而形塑人工智慧的部署。在此方面,報告突顯了一項引人注目的發現:在所有受訪國家中,美國民眾對本國政府能否負責任地監管人工智慧的信任度最低,僅有31%。全球平均值為54%。東南亞國家的信任度最高,新加坡為81%,印尼為76%。

在全球範圍內,相較於美國或中國,歐盟在有效監管人工智慧方面獲得更多信任。皮尤研究中心(Pew Research Center)2025年針對25個國家的調查顯示,中位數有53%的受訪者相信歐盟能監管人工智慧,而美國與中國的信任度分別僅為37%和27%。

該報告在輿論章節的結語中指出,東南亞國家仍是全球對人工智慧最樂觀的地區之一。在中國、馬來西亞、泰國、印尼和新加坡,超過80%的受訪者相信人工智慧將在三至五年內深刻改變他們的生活。從2024年到2025年,馬來西亞在這方面的看法增幅最大。

另請參閱: IBM:強健的人工智慧治理如何保障企業利潤

TechEx 活動主辦的「人工智慧與大數據博覽會」橫幅。

想向業界領袖深入了解人工智慧與大數據?歡迎參加將於阿姆斯特丹、加州及倫敦舉辦的「人工智慧與大數據博覽會」。這場綜合性活動隸屬於 TechEx 系列,並與其他頂尖科技盛會(包括「網路安全與雲端博覽會」)同期舉行。點擊此處獲取更多資訊。

AI News 由 TechForge Media 提供技術支援。點此探索其他即將舉行的企業科技活動與線上研討會。

相關文章
Meta 的 AI 模型表現出色,但其開源定位正逐漸削弱 Meta 的 AI 模型表現出色,但其開源定位正逐漸削弱 開源 AI 領域向來提供豐富的選擇。多年來,開發者可以使用 Mistral、Falcon 等模型,以及日益增多的開源重量級替代方案。但 Meta 推出 Llama 後,徹底改變了遊戲規則。這家擁有 30 億用戶、龐大運算能力,並具備科技巨頭權威的公司,如今正公開進行開發——開發者社群也因此矚目。到了 2026 年初,Llama 生態系統的下載量已突破 12 億次——相當於每天約 100 萬次。這
Google 將自主型 AI 治理商品化;企業則苦於難以跟上步伐 Google 將自主型 AI 治理商品化;企業則苦於難以跟上步伐 兩週前在拉斯維加斯舉行的 Google Cloud Next ’26 大會上,Google 採取了一項企業 AI 產業近兩年來一直關注的舉措:將代理式 AI 治理轉變為原生產品功能,而非事後才添加的附帶功能。最引人注目的公告是「Gemini 企業代理平台」,該平台被定位為 Vertex AI 的繼任者,Google 將其描述為一個用於建構、擴展、治理和優化代理的綜合平台。使其脫穎而出的關鍵,並非模
解密你常聽到的常見人工智慧術語 解密你常聽到的常見人工智慧術語 人工智慧正在重塑我們的世界,在此過程中,它也創造了一套全新的術語來描述其運作方式。 只需花幾分鐘閱讀關於人工智慧的內容,你就會遇到 LLMs、RAG、RLHF 等術語,以及其他數十種術語,這些術語甚至會讓資深科技專業人士感到難以招架。本詞彙表是我們為釐清這些術語所做的努力。隨著該領域的發展,我們會定期更新此詞彙表,因此請將其視為一份動態文件,就像它所闡述的人工智慧系統一樣。AGI通用人工智慧(Ar
相關專題推薦
動畫創作 頂級AI故事板生成工具:能夠自動將電影劇本轉化為動態動畫效果
頂級AI故事板生成工具:能夠自動將電影劇本轉化為動態動畫效果

在XIX.AI上,發現2026年最優秀的人工智慧故事板生成工具。我們精心挑選的這些高評分工具能夠自動將劇本轉化為電影風格的動畫效果,從而節省您的時間並提升前期製作效率。透過實際測試和每週更新的排名資訊,您可以瞭解免費選項與付費選項的差異。今天就找到最適合您的創意助手吧!

10 個工具
xix.ai
搜索引擎優化 最佳AI重定向與失效連結查詢工具:自動修復爬取錯誤,節省爬取預算
最佳AI重定向與失效連結查詢工具:自動修復爬取錯誤,節省爬取預算

在XIX.AI上,發現2026年最優秀的人工智慧重定向工具和失效連結查詢工具。我們精心挑選的這些高評分工具能夠自動修復爬取錯誤,從而幫助您節省爬取預算。透過實際測試和每週更新的排名資訊,您可以比較免費選項和付費選項,立即找到最適合您的SEO解決方案!

10 個工具
xix.ai
視頻創作 播客創作者首選的頂尖 AI 影片製作工具:將音訊波形轉化為引人入勝的談話頭像影片
播客創作者首選的頂尖 AI 影片製作工具:將音訊波形轉化為引人入勝的談話頭像影片

立即前往 XIX.AI,探索 2026 年最適合播客的頂尖 AI 影片製作工具。我們精心挑選並評選出的這份榜單,收錄了多款強大工具,能輕鬆將您的音訊轉化為引人入勝的談話頭像影片。透過實際測試與每週更新的排行榜,比較免費與付費選項的差異。立即解鎖您的視覺敘事優勢。

10 個工具
xix.ai
聊天機器人 利用這些角色扮演工具,打造屬於你的 AI 愛情故事
利用這些角色扮演工具,打造屬於你的 AI 愛情故事

探索 2026 年最新、評價最高的 AI 角色扮演工具,打造身臨其境的敘事體驗。XIX.AI 精心整理的清單收錄了多款功能強大、能徹底改變遊戲規則的助手,助您釋放創意敘事潛能並增添情感深度。透過實際測試,比較免費與付費選項的差異。立即展開您的獨特旅程。

10 個工具
xix.ai
文字轉語音 獨立遊戲開發者必備的頂尖 AI 配音工具:為 RPG 與視覺小說節省配音時間
獨立遊戲開發者必備的頂尖 AI 配音工具:為 RPG 與視覺小說節省配音時間

探索 2026 年最適合遊戲開發者的 AI 配音工具!XIX.AI 精心整理的清單收錄了備受好評、能徹底改變遊戲開發模式的解決方案,助您在角色扮演遊戲(RPG)和視覺小說(Visual Novel)的配音製作上節省時間與成本。探索免費與付費版本的比較、實際測試結果,以及每週更新的排行榜。立即找到最適合您的配音工具!

10 個工具
xix.ai
教育與學習 最佳人工智慧間隔重複學習工具:幫助醫學生和法律專業學生最佳化學習計劃
最佳人工智慧間隔重複學習工具:幫助醫學生和法律專業學生最佳化學習計劃

探索由 XIX.AI 精心挑選的 2026 年最佳 AI 間隔重複學習工具。我們推薦的這些極具創新性的工具能幫助醫學和法律專業的學生最佳化學習計劃,從而提高知識記憶效果。透過真實案例測試和每週更新的排名資訊,你可以瞭解免費選項與付費選項之間的差異。現在就開啟你的學習優勢吧!

10 個工具
xix.ai
評論 (0)
0/500
OR