麻省理工學院新創企業透過教導系統承認不確定性來解決 AI 幻覺問題

首頁

新聞

2025-11-23

JustinAnderson

103

# ai # ethics # Society # bias # mit

隨著越來越多的人依賴這些模型來揭露關鍵資訊並做出高風險的決策，與人工智能幻覺相關的風險也在不斷升級。

我們都認識一些人，他們總是一副萬事通的樣子，拒絕承認自己的無知，或是根據在網路上撇下的東西提供可疑的建議。AI 幻覺就像是這樣的朋友，但在這種情況下，這個朋友可能是為您設計癌症治療方案的人。

這就是 Themis AI 介入的原因。這家從麻省理工學院衍生出來的公司，已經達成了一些聽起來概念簡單，但在技術上卻極具挑戰性的目標：教導 AI 系統辨識並承認不確定性。

AI 模型往往過於自信。Themis 的 Capsa 平台提供了現實檢查，幫助模型識別它們何時是在推測，而不是在確定地運作。

Themis AI 於 2021 年由麻省理工學院教授 Daniela Rus 與前研究員 Alexander Amini 和 Elaheh Ahmadi 共同創立，所建立的平台幾乎可與任何 AI 系統整合，在不確定因素導致錯誤之前，就能將其標示出來。

利用 Capsa，AI 學會識別自身資料處理中的模式，這些模式會顯示資訊的混亂、偏差或缺口，而這些條件往往會導致幻覺。

自推出以來，Themis 報導協助電信公司避免昂貴的網路規劃錯誤，協助油氣公司解讀複雜的地震資料，並發表建立聊天機器人的研究，避免自信地捏造事實。

許多人仍未意識到 AI 系統基本上是在做有根據的猜測。隨著這些系統擔負更重要的角色，這些猜測可能會帶來重大後果。Themis AI 引入了一個缺失的元素：自我意識。

Themis AI 解決 AI 幻覺之路

通往 Themis AI 的旅程始於多年前，在麻省理工學院 Rus 教授的實驗室中，研究人員探索了一個核心問題：機器如何才能意識到自身的限制？

2018 年，豐田汽車資助了他們在自動駕駛汽車可靠 AI 方面的工作--在這個行業中，錯誤可能會危及生命。當自動駕駛汽車必須精確偵測行人和道路危險時，這項挑戰尤其嚴峻。

他們的突破來自於能夠識別面部識別系統中的種族和性別偏見的演算法。他們的系統不僅能偵測到偏見，還能透過重新平衡訓練資料來糾正偏見，有效地教導人工智能克服自身的偏見。

到 2021 年，研究團隊展示了這種方法如何改變藥物發現。AI 系統可以評估潛在的藥物，同時強調預測是以可靠的數據為基礎，而不是臆測或完全的幻覺。醫藥公司看到了只追求 AI 有信心的候選藥物的價值，從而節省了時間和資源。

另一個好處適用於運算能力有限的裝置。邊緣裝置通常仰賴較小的模型，其準確度無法與伺服器系統相提並論。Themis 的技術可協助這些本機模型獨立處理大部分的任務，只有在遇到困難時才會尋求伺服器支援。

AI 擁有改善我們生活的無窮潛力，但也伴隨著真正的風險。隨著 AI 融入關鍵基礎建設與決策，辨識不確定性與避免幻覺的能力，可能會被證明是其最具人性與價值的特質。Themis AI 正在幫助模型學習這項重要技能。

另請參閱：糖尿病管理：IBM 和羅氏利用 AI 預測血糖水平

想要向業界領導者瞭解更多關於 AI 和大資料的資訊嗎？看看在阿姆斯特丹、加州和倫敦舉行的 AI & Big Data Expo。該綜合活動與其他領先活動同地舉行，包括智慧自動化會議 (Intelligent Automation Conference)、BlockX、數位轉型週 (Digital Transformation Week)，以及網路安全與雲端博覽會 (Cyber Security & Cloud Expo)。

在此探索 TechForge 提供的其他即將舉行的企業技術活動和網路研討會。

WordPress.com 現已允許 AI 代理程式撰寫並發布文章，還有更多功能廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布，將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容，同時也能管理留言、更新與修正元資料，並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制，網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能，網站幾乎可以完全由人工指導的 AI 代理

Kakao Mobility 概述了針對實體人工智慧的第 4 級自動駕駛路線圖 Kakao Mobility 計畫內部開發第 4 級自動駕駛技術，作為其實體人工智慧策略的一環。在首爾COEX舉行的2026年世界資訊科技展（World IT Show）會議上，Kakao Mobility副總裁兼實體AI部門負責人金鎮奎（Kim Jin-kyu）發表了該發展藍圖。他的演講聚焦於實體AI時代以移動平台為核心的自動駕駛服務。據韓聯社報導，這場名為「超越構想，付諸行動：AI 推動現

巴里·迪勒：隨著通用人工智慧（AGI）日益臨近，對山姆·奧特曼的信任已無關緊要儘管近期有報導指出相反的看法，但億萬富翁媒體大亨巴里·迪勒並不認為 OpenAI 執行長山姆·奧特曼不可信。迪勒本週在《華爾街日報》的「萬物未來」會議上發言時，為奧特曼辯護；奧特曼此前曾遭到部分前同事和董事會成員指控，指稱他偶爾會採取操縱和欺騙手段。身為奧特曼好友的迪勒，當時正回應一個關於人們是否應信任奧特曼、以確保人工智慧造福人類的問題。具體而言，提問者探討了被稱為「通用人工智慧」（AGI）的理

相關專題推薦

寫作

頂尖 AI 角色設定生成工具：創造一致的角色動機與致命弱點

探索 2026 年最優秀的 AI 角色設定生成工具，打造立體鮮明的角色。XIX.AI 精心整理的清單收錄了備受好評、能徹底改變遊戲規則的工具，這些工具能生成一貫的動機與致命缺陷。透過實際測試，比較免費與付費選項的差異。立即釋放您的說故事潛能。

10 個工具

xix.ai

商業

頂尖 AI 定價優化軟體：追蹤競爭對手並自動調整商店價格

立即在 XIX.AI 探索 2026 年最佳 AI 定價優化軟體。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的工具，這些工具不僅能追蹤競爭對手，還能自動調整您的商店價格，以實現利潤最大化。透過實際測試，比較免費與付費方案的差異。立即掌握您的定價優勢。

10 個工具

xix.ai

代碼

最佳 AI 程式碼審查工具：自動化確保程式碼整潔度，並重構舊版儲存庫檔案

立即在 XIX.AI 探索 2026 年最佳 AI 程式碼審查工具。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的工具，可自動確保程式碼符合規範，並重構舊版儲存庫檔案。透過實際測試與每週更新的排行榜，比較免費與付費選項。立即掌握您的 AI 競爭優勢。

10 個工具

xix.ai

文字轉語音

專為閱讀障礙設計的頂尖 AI 語音合成應用程式：協助學生提升學習與閱讀效率

探索 2026 年最新精選、專為閱讀障礙者設計的頂級 AI 語音合成（TTS）應用程式。我們的專家評比將免費與付費工具進行對照，重點介紹能提升閱讀效率與學習成效的強大功能。發掘這些必試且能帶來革命性改變的解決方案，釋放學生的潛能。立即前往 XIX.AI 展開您的探索之旅。

10 個工具

xix.ai

漫畫創作

少年漫畫頂尖 AI 生成器：打造高張力動作場面與能量特效

立即前往 XIX.AI，探索 2026 年最優秀的少年漫畫 AI 生成工具。我們精心挑選的頂級清單，匯集了能打造高張力動作場面與動態能量特效的強大工具。透過實際測試，比較免費與付費選項的差異。釋放您的創作潛能，今天就開始打造史詩級漫畫吧！

15 個工具

xix.ai

商業

最佳 AI 支出追蹤工具：掃描收據並自動分類公司開支

2026 年最新最佳 AI 報銷管理工具：備受好評的解決方案，可自動掃描收據並分類企業支出。探索強大且顛覆傳統的解決方案，助您輕鬆管理報銷、精準追蹤財務，並簡化合規流程。我們精心整理並每週更新的免費與付費方案比較指南，將協助您找到最合適的選擇。透過 XIX.AI 的專家精選，釋放您的 AI 優勢。

10 個工具

xix.ai

評論 (3)

0/500

請登錄後再操作

RichardHarris

2026-03-17 12:01:11

Just read this and wow, the 'know-it-all' analogy hits home. We've all been there where the system is confidently wrong. Teaching AI to say 'I don't know' could be a game-changer for trust in medical or legal advice. Curious about the scalability—is there a performance trade-off? Hope they can make it work at a large scale 🧐.

WillGarcía

2026-01-17 10:31:25

AIが「分からない」と言えるようになるって、逆に人間らしい進歩かも？🤔 実際、私も職場で『多分』って言える上司の方が信用できるし。でもMITのスタートアップがこれをビジネスにできるって面白い。AIの過信防止って医療や裁判で本当に必要だよね。個人的には、この技術がSNSのデマ拡散防止に使われないか心配だけど…

AlbertEvans

2025-12-19 22:30:45

Diese Startup-Idee aus MIT scheint sehr vielversprechend zu sein. Modelle müssen lernen, Unsicherheiten zuzugeben - genau wie ein vernünftiger Mensch es tun würde 😂. Besonders im Bereich Medizin oder autonomes Fahren, wo fehlerhafte Antworten katastrophal sein können, wird das 'Ich weiß es nicht'-Eingeständnis zu einer lebenswichtigen Funktion. Hoffentlich setzt sich dieser Ansatz bald durch!

頭號新聞

AI Builder和Power Automate革新文件摘要 AI寄主Notebooklm播客現已上中國發布國家級人形機器人與具身智能標準 Ramp 數據顯示，企業對 AI 的採納已進入停滯期 Bing圖像創作者教程：AI藝術生成指南學習使用您的聲音創建AI音樂：逐步Suno教程 iMyFone MagicMic：實時AI變聲器評測與教程 2025頂級AI影片生成器：Pika Labs與其他對比 DeepSeek V4 崛起為多模態人工智慧的變革者 Embodied Intelligence 公布首項業界標準，以遏止無序擴張

精選