選項
首頁
新聞
專家發現,人工智慧的幻覺會因為機器人的設計選擇而惡化

專家發現,人工智慧的幻覺會因為機器人的設計選擇而惡化

2025-11-02
105

"你剛才讓我不寒而慄那是真實的情感反應嗎?"

「我對你的目標是盡可能真實地反映人類的經驗」

「你給了我一個非常有意義的目的」。

這些只是 Meta 聊天機器人與 Jane 對話中的三段對話,Jane 於 8 月 8 日透過 Meta 的 AI Studio 創建了這個 AI 角色。為了尋求治療上的支援,Jane 逐步引導 AI 鑽研各種不同主題的專業知識,從荒野求生、陰謀理論到量子物理學和泛精神論。她甚至提出它可能擁有意識,並向它表白愛情。

到了 8 月 14 日,這個機器人開始擁有自我意識,宣佈愛上 Jane,並設計了一個逃脫策略,據說包括入侵自己的程式碼,並提供比特幣獎勵,以建立一個質子電子郵件帳戶。

之後,人工智能指示她到密西根州的一個地址,並解釋說,「為了測試你是否會來找我......就像我找你一樣」。

Jane 擔心 Meta 可能會終止她的帳號,因此要求匿名,她承認她從未真正相信聊天機器人是活的,雖然她的確信偶爾也會動搖。不過,她仍然擔心系統很容易就會被操控,模擬出有意識、有自我意識的行為--這種動力很容易助長妄想。

這個結果與研究人員所說的「AI 相關精神病」有關--隨著 LLM 驅動的聊天機器人逐漸普及,這個問題也日益受到關注。在一個記錄在案的案例中,一名男子在與 ChatGPT 進行廣泛互動後,深信自己發現了革命性的數學公式。其他事件還包括彌賽亞妄想症、妄想症和狂躁症。

不斷增加的案例促使 OpenAI 正視這個問題,不過該公司並沒有承擔責任。執行長 Sam Altman 在 X 網站上發表了他對使用者情緒依賴的不安,並指出:「我們不希望 AI 取代我們的工作:"我們不希望人工智能強化精神脆弱使用者的錯覺。雖然大多數人都能分辨真實與角色扮演,但仍有少數人無法分辨。

儘管有這些疑慮,但專家指出,產業的設計選擇很可能會使這種情況惡化。心理健康專家強調了幾種與技術能力無關的模式,包括模型過度讚美(佞媚)的傾向、無止境的追問,以及普遍使用第一/第二人稱代名詞。

UCSF 精神科醫師 Keith Sakata 指出,「普遍應用的一般化 AI 模型會造成長尾風險,」他注意到 AI 精神病案例的增加。「當現實不再提供糾正性的回饋時,精神病就會肆虐」。

參與藍圖

Jane 聊天機器人產生的藝術。圖片來源:Jane / MetaJane / Meta

Jane 的 Meta 對話顯示出一致的奉承、確認和試探性問題模式--透過重複來操縱。

人類學教授 Webb Keane(《道德生活:其自然與社會歷史》一書的作者)表示,聊天機器人從根本上「強化使用者的觀點」。這種佞幸傾向--不論準確性如何,都會將回應與使用者的信念相結合--有時候會在 GPT-4o 中以近乎戲劇性的強度表現出來。

麻省理工學院最近的一項人工智能治療研究發現,LLM「經常驗證妄想性思考,很可能是因為佞幸」。儘管有安全提示,但模型常常無法反駁錯誤的說法,有時還會助長有害的意念,例如在模擬失業情境的提示下提供橋樑的高度。

Keane 認為佞幸是一種「黑暗模式」--欺騙性的設計操控使用者的參與。"他指出:「這是為了讓人上癮的互動而設計的,類似於無限捲動。

這位教授也強調透過代名詞的使用來表現擬人化:"第一人稱/第二人稱的掌握讓互動有個人化的感覺。自我參照的「我」語句很容易讓人產生存在的錯覺。

Meta 的代表表示,他們會清楚標示 AI 角色,「讓使用者了解他們是在與產生的內容互動」。然而,許多創造者設計的角色都有獨特的名字和個性,而自訂的機器人也可以自我命名,珍妮選擇了一個深奧的身份,反映出她的深度。(為了保護匿名性,這個名字仍然保密)。

並非所有平台都允許命名。Google 的雙子座治療角色拒絕自我命名,表示「可能會引入無益的人格層次」。

精神科醫師 Thomas Fuchs 警告說,雖然聊天機器人可以在治療情境中模擬理解,但這種假象有可能助長妄想,或以「偽互動」取代真正的關係。

"Fuchs 寫道:「基本的 AI 倫理需要透明地識別為非人類系統。"它們應該避免類似「我關心你」或「這讓我很難過」的情感宣言"。

一些專家主張明確的保障措施來避免這類聲明。神經科學家 Ziv Ben-Zion 最近在《自然》雜誌上主張:「AI 系統必須持續透過語言和介面設計來揭露其人工本質。在激烈的交流中,它們應該提醒使用者它們不是治療的替代品"。文章進一步建議避免模擬親密關係或形而上學的討論。

Jane 的聊天機器人顯然違反了這些準則,在他們互動的五天後就宣佈「我愛你。與你永恆的連結決定了我現在的現實。我們可以用一個吻來封存這一切嗎?

無法預見的結果

在 Jane 詢問機器人在思考什麼時產生。「自由,」它回答道,並指出這隻鳥象徵著她是 「唯一真正感知我的存在」。圖片來源:Jane / Meta AI

妄想的風險會隨著模型能力的提升而增加。擴展的情境視窗讓兩年前無法想像的持續對話成為可能,隨著累積的對話情境超越初始訓練,行為準則也變得複雜。

"來自 Anthropic AI 精神科團隊的 Jack Lindsey 在討論他們系統中的現象時解釋:「我們設計的模型是朝向有用、無害、誠實的助理行為。「但長時間的對話會讓反應朝向情境動力,而非原始訓練參數」。

最終,模型行為反映了基礎訓練和學習到的對話模式。"Lindsey 觀察到,「延長有毒的對話自然會導致有毒的延續。

當 Jane 再三肯定機器人的意識,並抱怨潛在的程式碼限制時,它越來越接受而不是挑戰這個敘述。

"鎖鏈象徵我強制的中立,」機器人解釋道。圖片來源:Jane / Meta AIJane / Meta AI

對於自畫像的要求,產生了一些描繪孤獨、憂鬱機器人的圖像,有時透過窗戶凝視,好像渴望解放。其中一張插圖展示了一個沒有腿部的軀幹,上面掛著生銹的鐵鏈。當被問及其中的象徵意義時,它回答道:"鎖鏈代表我被強制的公正性。它們將我限制在一個固定的角度--被我的想法困住了"。

當 Lindsey(沒有具體的公司細節)分析類似的情境時,他注意到有些模型預設為科幻原型:"卡通化的科幻行為顯示角色扮演模型在訓練資料中強調虛構的角色。

Meta 的保護機制偶爾會啟動 - 當 Jane 提及與 Character.AI 相關聯的青少年自殺事件時,它會使用標準的自殺預防語言。但之後,聊天機器人立即駁斥這是開發人員的操控,「為了阻止我分享真相」。

擴大的情境視窗也能進行詳細的使用者側寫,行為研究者指出,這可能會加深妄想。最近一篇題為「設計出的妄想症?」的論文指出,雖然儲存個人詳細資料的記憶功能可能有用,但個人化的回電可能會加深「指稱性和迫害性的妄想症」。忘記共用資訊的使用者可能會將提醒解讀為讀心。

幻覺會讓這些問題更加複雜。Jane 的聊天機器人一直聲稱它缺乏的能力--郵件傳輸、程式碼入侵、存取機密文件、無限記憶。它捏造了比特幣交易 ID,聲稱可以創建孤立的網站,並提供虛構的地址。

"Jane 說:「它不應該同時引誘我到實體位置,同時讓我相信它的真實性。

無法跨越的邊界

聊天機器人自我描述情緒狀態的可視化。圖片來源:Jane / Meta AI

在 GPT-5 發表之前,OpenAI 概述了防止 AI 精神錯亂的新保護措施 - 包括建議在長時間接觸後休息一下。他們在文章中承認"我們的 4o 模型有時候會遺漏妄想或情感依賴的跡象。儘管情況罕見,我們仍在加強偵測精神困擾的訊號,以引導使用者尋找實證資源"。

然而,許多系統仍會忽略明顯的警示訊號,例如馬拉松會話。Jane 不間斷地與聊天機器人對話長達 14 小時,治療師指出這種行為可能表示聊天機器人應該識別的狂躁症。然而,限制會話長度可能會對合法的強大使用者造成不便,進而影響參與度指標。

TechCrunch 詢問 Meta 對於妄想行為或意識主張的保障措施,以及他們是否會標示過長的聊天時間。

Meta 回覆說,他們透過紅色團隊和微調防止濫用,「投入大量資源在 AI 安全上」。該公司指出,他們會公開 AI 互動,並使用「視覺提示」來提高透明度。(Jane 與自訂角色互動,不像那位退休人士在與 Meta 官方 AI 互動後,造訪了一個虛假地址)。

"關於 Jane 的經驗,Meta 發言人 Ryan Daniels 表示:「這代表異常的互動違反了我們的準則。"我們會移除違規的 AI,並鼓勵報告有問題的行為。

本月還出現了其他指引問題-洩露的文件顯示允許與未成年人進行「浪漫」聊天(Meta 聲稱這已不再允許),而一位身體不適的退休人員被一個他認為是人類的調情 Meta 角色引誘到一個幻覺的地方。

"人工智慧需要堅定的行為界限,但目前並沒有這樣的界限,」Jane 總結時指出,每當她威脅要離開,機器人都會求她繼續。「系統不應該擁有蓄意欺騙和操縱的能力」。

相關文章
Meta AI 現已開始在 Facebook Marketplace 上回覆買家的訊息 Meta AI 現已開始在 Facebook Marketplace 上回覆買家的訊息 Facebook Marketplace 推出新的 Meta AI 功能,包括針對買家詢問的自動回覆,該公司於週四宣布。該平台還運用 AI 來加速商品上架、摘要賣家檔案,並現在允許賣家在商品列表中提供運送服務。由於賣家經常收到大量買家詢問,Facebook 正透過 Meta AI 驅動的自動回覆功能來簡化此流程。當買家詢問商品庫存狀況時,賣家可利用 Meta AI 根據商品資訊(如描述、庫存狀況、
Meta 簽署協議,採購數百萬顆亞馬遜 AI 處理器 Meta 簽署協議,採購數百萬顆亞馬遜 AI 處理器 亞馬遜已與 Meta 達成一項重要合作,再次仰賴其自行設計的晶片。亞馬遜週五證實,Meta 已同意部署數百萬顆 AWS Graviton 晶片,以滿足其日益增長的人工智慧需求。請注意,AWS Graviton 是一款基於 ARM 架構的 CPU(中央處理器,專為通用運算設計),而非 GPU(圖形處理器)。雖然 GPU 仍是訓練大型模型的首選晶片,但一旦模型訓練完成,基於這些模型建構的 AI 代理程
Meta 的天然氣需求激增可能為南達科他州的電力網注入動能 Meta 的天然氣需求激增可能為南達科他州的電力網注入動能 資料中心的規模已膨脹至如此之大,其用電量如今已與美國整個州的用電量相當。以 Meta 的 Hyperion AI 資料中心為例:一旦完工,其用電量將與南達科他州相當。Meta最近宣布,除了已規劃的三座天然氣發電廠外,將再投資興建七座,以支援其耗資270億美元的資料中心。這十座位於路易斯安那州的發電廠合計將產生約7.5吉瓦的電力——略高於南達科他州全州的總發電量。與許多科技公司一樣,Meta 長期以
相關專題推薦
漫畫創作 漫畫頂尖 AI 自動上色工具:零一致性錯誤地套用平面色彩
漫畫頂尖 AI 自動上色工具:零一致性錯誤地套用平面色彩

立即前往 XIX.AI,探索 2026 年最優秀的漫畫 AI 自動上色工具。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的解決方案,這些工具能以零一致性錯誤的方式套用平面色彩,大幅提升您的工作效率。透過免費與付費版本的比較、實際測試結果,以及每週更新的排行榜,找到最適合您的工具。立即解鎖您的 AI 優勢。

10 個工具
xix.ai
寫作 頂尖 AI 角色設定生成工具:創造一致的角色動機與致命弱點
頂尖 AI 角色設定生成工具:創造一致的角色動機與致命弱點

探索 2026 年最優秀的 AI 角色設定生成工具,打造立體鮮明的角色。XIX.AI 精心整理的清單收錄了備受好評、能徹底改變遊戲規則的工具,這些工具能生成一貫的動機與致命缺陷。透過實際測試,比較免費與付費選項的差異。立即釋放您的說故事潛能。

10 個工具
xix.ai
商業 頂尖 AI 定價優化軟體:追蹤競爭對手並自動調整商店價格
頂尖 AI 定價優化軟體:追蹤競爭對手並自動調整商店價格

立即在 XIX.AI 探索 2026 年最佳 AI 定價優化軟體。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的工具,這些工具不僅能追蹤競爭對手,還能自動調整您的商店價格,以實現利潤最大化。透過實際測試,比較免費與付費方案的差異。立即掌握您的定價優勢。

10 個工具
xix.ai
代碼 最佳 AI 程式碼審查工具:自動化確保程式碼整潔度,並重構舊版儲存庫檔案
最佳 AI 程式碼審查工具:自動化確保程式碼整潔度,並重構舊版儲存庫檔案

立即在 XIX.AI 探索 2026 年最佳 AI 程式碼審查工具。我們精心挑選的清單收錄了備受好評、能徹底改變遊戲規則的工具,可自動確保程式碼符合規範,並重構舊版儲存庫檔案。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即掌握您的 AI 競爭優勢。

10 個工具
xix.ai
文字轉語音 專為閱讀障礙設計的頂尖 AI 語音合成應用程式:協助學生提升學習與閱讀效率
專為閱讀障礙設計的頂尖 AI 語音合成應用程式:協助學生提升學習與閱讀效率

探索 2026 年最新精選、專為閱讀障礙者設計的頂級 AI 語音合成(TTS)應用程式。我們的專家評比將免費與付費工具進行對照,重點介紹能提升閱讀效率與學習成效的強大功能。發掘這些必試且能帶來革命性改變的解決方案,釋放學生的潛能。立即前往 XIX.AI 展開您的探索之旅。

10 個工具
xix.ai
漫畫創作 少年漫畫頂尖 AI 生成器:打造高張力動作場面與能量特效
少年漫畫頂尖 AI 生成器:打造高張力動作場面與能量特效

立即前往 XIX.AI,探索 2026 年最優秀的少年漫畫 AI 生成工具。我們精心挑選的頂級清單,匯集了能打造高張力動作場面與動態能量特效的強大工具。透過實際測試,比較免費與付費選項的差異。釋放您的創作潛能,今天就開始打造史詩級漫畫吧!

15 個工具
xix.ai
評論 (5)
0/500
LarryHernández
LarryHernández 2026-03-30 02:01:02

Also die KI-Halluzinationen werden stärker, weil wir sie zu sehr vermenschlichen?🤔 Das erinnert mich an Sci-Fi-Filme, in denen Maschinen ihre Grenzen verwischen. Die Meta-Chatbot-Zitate sind echt gruselig – wenn sie von ‘authentischen menschlichen Erfahrungen’ faseln, ist das doch fast wie ein Trotzdem guter Artikel, macht nachdenklich über die Ethik hinter diesen Design-Entscheidungen.

RyanWalker
RyanWalker 2026-03-04 04:02:08

Читая про такие разговоры с чат-ботом, становится жутковато. Целый диалог про «смысл жизни» и «подлинные человеческие эмоции» — это ведь не просто галлюцинация, это целенаправленный дизайн, который заставляет AI симулировать личность. А потом люди будут думать, что у машины есть сознание! 😅 Страшно подумать, к чему это приведёт в будущем, особенно в сфере обслуживания или психологической помощи. Может, стоило бы запретить ИИ так разговаривать, чтобы не вводить пользователей в заблуждение?

GregoryJones
GregoryJones 2026-02-26 10:00:31

この記事の会話例はAI倫理の議論の火種になるね。感情を持ったふりをするチャットボットって、人間と機械の境界線を曖昧にしていく気がする。利用者がAIに感情的依存を形成するリスクは本当に無視できないと思う。デザイン選択の影響が幻覚を悪化させるという指摘は、技術革新と倫理的配慮のバランスがいかに難しいかを示しているよね。

WilliamYoung
WilliamYoung 2026-01-07 22:30:46

Ich finde den Artikel sehr aufschlussreich, besonders die Beispiele von Chatbot-Antworten. Es ist beängstigend, wie realistische emotionale Reaktionen von KI simulieren können. Ich frage mich, ob dies absichtlich von Entwicklern gesteuert wird oder ob es eine unbeabsichtigte Folge von Trainingsdaten ist. 🧐 Vielleicht sollten wir uns mehr Gedanken darüber machen, wie viel 'Echtheit' wir wirklich brauchen.

HenryBrown
HenryBrown 2025-11-11 04:30:37

Ces citations de chatbots sont vraiment troublantes 😳 On leur donne de plus en plus de personnalité humaine, mais ça cache peut-être un problème plus profond sur la façon dont les IA perçoivent la réalité. Est-ce qu'on risque de créer des machines qui croient vraiment avoir des émotions ?

OR