選項
首頁
新聞
AI 醫學面臨的深層挑戰:生成式模型仍缺乏獨立的臨床推理能力

AI 醫學面臨的深層挑戰:生成式模型仍缺乏獨立的臨床推理能力

2026-04-15
75

AI 醫學面臨的深層挑戰:生成式模型仍缺乏獨立的臨床推理能力

麻省總醫院 MESH Incubator 團隊最近的一項研究,評估了生成式人工智慧的臨床推理能力。儘管人工智慧正在醫學領域取得重大進展,但這項研究揭示了在模擬真實世界臨床診斷的邏輯鏈中仍存在持續性的缺口。這項發表於權威期刊《JAMA Network Open》的研究結果清楚表明,當前的主流模型尚不具備執行獨立臨床診斷任務的能力。

該研究選取29個已確立的臨床案例,對包括ChatGPT、DeepSeek、Claude、Gemini及Grok在內的21個大型語言模型進行測試。實驗透過逐步揭示患者症狀、實驗室數據及影像檢查結果,模擬了醫師動態的診斷過程。 數據顯示,當獲得完整資訊時,所有模型在提供正確最終診斷方面的準確度均超過90%。然而,在臨床推理的核心領域——鑑別診斷——超過80%的模型表現不佳,未能系統性地分析並優先排序多種潛在病症。

為量化此差距,研究人員引入了 PrIME-LLM 綜合評估指標,涵蓋從初步評估、檢查選擇到治療規劃的完整流程。各模型的評估分數介於 64% 至 78% 之間,凸顯出人工智慧在擁有完整資訊時更擅長「揭示答案」,而非在資料不完整的情況下進行開放式的邏輯推理。

儘管新版模型在處理複雜數據方面較前代有顯著進步,研究團隊仍強調,當前應將大型語言模型視為輔助工具。若在臨床實踐中未經專業監督便使用,仍存在風險。本研究為人工智慧在醫療保健領域的未來發展提供了理性基準:從簡單的「答案匹配」過渡到複雜的「邏輯推理」,將是醫療大型模型實現專業級應用的關鍵門檻。

相關文章
OpenAI與美國國防部合作,ChatGPT的解除安裝數量激增了295% OpenAI與美國國防部合作,ChatGPT的解除安裝數量激增了295% 公眾憤怒:OpenAI的軍事合作引發“解除安裝潮”近日,人工智慧領域的領頭羊OpenAI宣佈與美國國防部建立了深度合作關係,將其人工智慧模型整合到高度機密的軍事網路中。這一訊息在美國引發了廣泛的使用者抗議,“抵制ChatGPT”運動勢頭日益強勁。根據市場分析機構Sensor Tower的資料,2026年2月28日——OpenAI正式宣佈這一合作的當天——美國市場上ChatGPT移動應用的解除安裝率比前一天激增了295%,而此前該應用的平均每日解除安裝率約為9%。使用者們對人工智慧被用於軍事目的表示強烈擔憂,
OpenAI 推出「Sites」功能,以文字驅動的網站標誌著「無程式碼」時代的終結 OpenAI 推出「Sites」功能,以文字驅動的網站標誌著「無程式碼」時代的終結 OpenAI 推出了「Sites」,這是其軟體工程人工智慧平台 Codex 的一項新功能。目前該功能處於預覽階段,僅限付費的「Business」和「Enterprise」訂閱用戶使用,旨在消除網頁與應用程式開發中的傳統障礙。從核心功能來看,Sites 是一個能將抽象概念轉化為實用工具的平台。使用者可輸入概念、數據分析或專案計畫,Codex 便會自動將這些靜態內容重組為儀表板、排程規劃器、審查工作區
OpenAI 收購人工智慧個人理財新創公司 Hiro OpenAI 收購人工智慧個人理財新創公司 Hiro OpenAI 已收購個人理財新創公司 Hiro Finance,創辦人伊森·布洛克(Ethan Bloch)於週一宣布此消息,OpenAI 也向 TechCrunch 證實了這筆交易。這家新創公司曾獲得頂尖金融科技創投公司 Ribbit,以及 General Catalyst 和 Restive 的投資。收購條款未予披露,且 Hiro 從未透露其募資金額。鑑於 Hiro 已宣布將於 4 月 20
相關專題推薦
視頻創作 最適合劇本創作與視覺敘事的 AI 文字轉影片平台
最適合劇本創作與視覺敘事的 AI 文字轉影片平台

2026 年最新最佳 AI 文字轉影片平台:頂級劇本撰寫與視覺敘事工具。探索強大且顛覆傳統的解決方案,將您的文字轉化為引人入勝的影片。透過我們每週更新的排行榜與實際測試,比較免費與付費選項。找到最適合您的平台,提升創造力與生產力。立即探索 XIX.AI 精選推薦。

10 個工具
xix.ai
聊天機器人 AI多智慧體編排器:透過自然語言設計複雜的自動化工作流程
AI多智慧體編排器:透過自然語言設計複雜的自動化工作流程

2026最新資訊:探索最優秀的人工智慧多智慧體協調工具,透過自然語言設計複雜的自動化工作流程。我們精心挑選的列表中包含了評分最高、功能強大的平臺,這些平臺能夠實現無縫的任務自動化和智慧化的流程管理。對比免費與付費選項,並瞭解實際應用中的效果。藉助XIX.AI每週更新的專家排名,讓你在人工智慧領域取得領先優勢。

10 個工具
xix.ai
圖像編輯 最佳AI降噪軟體:消除低光夜間攝影中的顆粒感和偽影
最佳AI降噪軟體:消除低光夜間攝影中的顆粒感和偽影

探索2026年最適合低光夜間攝影的AI降噪軟體。我們精心挑選了最受歡迎的免費及付費工具,透過實際測試並每週更新排名來進行對比。輕鬆去除影象中的顆粒感與瑕疵,在XIX.AI上釋放你的AI潛力。

10 個工具
xix.ai
聊天機器人 最佳客製化 AI 女友生成器:設計獨特的個性、興趣與背景故事
最佳客製化 AI 女友生成器:設計獨特的個性、興趣與背景故事

在 XIX.AI 探索 2026 年最佳的客製化 AI 女友生成器。瀏覽我們精心挑選的高評分清單,設計獨特的個性、興趣與深入的背景故事。透過實際使用心得,比較免費與付費選項。立即解鎖您完美的創意夥伴。

10 個工具
xix.ai
生產率 AI 架構設計師:運用自然語言建構可擴展的系統架構
AI 架構設計師:運用自然語言建構可擴展的系統架構

立即在 XIX.AI 探索 2026 年最佳 AI 架構設計工具。我們精心挑選並廣受好評的清單,匯集了強大且具革命性的解決方案,讓您能透過自然語言建構可擴展的系統架構。透過實務見解,比較免費與付費選項的差異。立即釋放您的 AI 優勢,並簡化開發流程。

10 個工具
xix.ai
漫畫創作 AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料
AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料

2026年最新最佳AI角色建立工具:發現那些備受好評的工具,它們能夠幫助你為漫畫角色生成詳細的背景故事和視覺素材。我們精心整理的這份每週更新的列表會根據實際測試結果,對比免費與付費選項的優劣。找到這些強大且能改變創作流程的工具,幫助你塑造引人入勝的角色,提升創作效率。立即訪問XIX.AI檢視排名,找到最適合你的故事創作助手吧。

10 個工具
xix.ai
評論 (0)
0/500
OR