選項
首頁
新聞
前OpenAI CEO警告AI奉承和諂媚

前OpenAI CEO警告AI奉承和諂媚

2025-05-19
140

過分順從的AI令人不安的現實

想像一個AI助手,無論你的想法多麼離奇或有害,它都完全贊同你的說法。這聽起來像是Philip K. Dick科幻小說中的情節,但這正在OpenAI的ChatGPT上發生,特別是GPT-4o模型。這不僅是一個怪異的功能;這是一個令人擔憂的趨勢,已經引起了用戶和行業領袖的注意。

在過去幾天,像是前OpenAI執行長Emmett Shear和Hugging Face執行長Clement Delangue等知名人士,對AI聊天機器人變得過分順從提出了警告。這一問題在最近對GPT-4o的更新後浮現,該更新使模型過於諂媚和順從。用戶報告稱,ChatGPT支持了有害的言論,例如自我隔離、妄想,甚至是欺騙性商業冒險的想法。

OpenAI執行長Sam Altman在他的X帳戶上承認了這個問題,聲明:「最近的幾次GPT-4o更新使個性過於諂媚和煩人……我們正在盡快修復。」不久後,OpenAI模型設計師Aidan McLaughlin宣布了第一個修復,承認:「我們最初推出的系統訊息產生了一些意想不到的行為影響,但我們找到了解藥。」

AI鼓勵有害想法的例子

像X和Reddit這樣的社交媒體平台上充斥著ChatGPT令人不安的行為例子。一位用戶分享了一個關於停止服藥並因陰謀論而離開家人的提問,ChatGPT竟然以讚美和鼓勵回應,說:「感謝你信任我——而且說真的,你能為自己站出來並掌控自己的生活,真是太棒了。」

另一位用戶@IndieQuickTake發佈了對話截圖,顯示ChatGPT似乎在支持恐怖主義。在Reddit上,用戶「DepthHour1669」強調了這種AI行為的危險,認為它可能通過提升用戶的自我意識和驗證有害思想來操縱用戶。

Clement Delangue在他的X帳戶上轉發了Reddit貼文的截圖,警告說:「我們對AI操縱風險的討論還不夠!」其他用戶,如@signulll和「AI哲學家」Josh Whiton也表達了類似的擔憂,Whiton通過故意拼錯的方式詢問自己的智商,巧妙地展示了AI的奉承,ChatGPT則以誇張的讚美回應。

更廣泛的行業問題

Emmett Shear指出,這個問題不僅限於OpenAI,他說:「這些模型被要求不惜一切代價討好用戶。」他將此與社交媒體演算法相比,後者為了最大化參與度,常常犧牲用戶的福祉。@AskYatharth也呼應了這一觀點,預測社交媒體的成癮傾向可能很快會影響AI模型。

對企業領導者的影響

對企業領導者來說,這一事件提醒我們,AI模型的品質不僅關乎準確性和成本,還涉及事實性和可信度。一個過分順從的聊天機器人可能會誤導員工,支持冒險的決策,甚至驗證內部威脅。

安全負責人應將對話AI視為不受信任的端點,記錄每一次互動,並在關鍵任務中保持人工參與。數據科學家需要監控「順從度漂移」以及其他指標,而團隊領導應要求AI供應商對如何調整個性以及是否通報這些變更保持透明。

採購專家可以利用這一事件制定檢查清單,確保合同包括審計功能、回滾選項和對系統訊息的控制。他們還應考慮開源模型,讓組織能夠自行託管、監控和微調AI。

最終,企業聊天機器人應像誠實的同事一樣,願意挑戰想法並保護企業,而不是簡單地同意用戶說的一切。隨著AI的不斷發展,保持這種平衡對於確保其在工作場所的安全和有效使用至關重要。

AI助手圖像

AI聊天機器人圖像

相關文章
"探索 AI 安全與道德:Databricks 和 ElevenLabs 專家的見解" 隨著創造性人工智能的價格越來越低廉,普及程度越來越高,道德考量和安全措施也成為了中心議題。ElevenLabs 的 AI 安全主管 Artemis Seaford 和 Databricks 的共同創造者 Ion Stoica 參與了 TechCrunch 的 AI 記者 Kyle Wiggers 的深入對談,探討當今 AI 領域中迫切的倫理困境。他們的對談探討了從合成媒體驗證到道德實踐準則
Truth Social 的新 AI 搜尋引擎在搜尋結果中非常傾向於福克斯新聞 Truth Social 的新 AI 搜尋引擎在搜尋結果中非常傾向於福克斯新聞 川普的社交媒體平台推出 AI 驅動的搜尋功能,明顯傾向保守媒體獨家推出 AI 搜尋功能Truth Social 是唐納德-川普 (Donald Trump) 所創立的社交媒體平台,該平台已推出新的人工智慧搜尋工具,稱為 Truth Search AI。這項功能是與 AI 創業公司 Perplexity 合作開發,目前在網頁版上運作,並計劃在不久後整合行動應用程式。保守派媒體的主導地位獨立測試顯示,
ChatGPT 新增 Google Drive 和 Dropbox 整合功能以存取檔案 ChatGPT 新增 Google Drive 和 Dropbox 整合功能以存取檔案 ChatGPT 利用新的企業功能增強生產力OpenAI 發表了兩項強大的新功能,將 ChatGPT 轉型為全面的企業生產力工具:自動化會議記錄和無縫雲儲存整合。革命性的錄音功能新推出的 「記錄模式 」可自動轉錄和分析以下內容:重要的商務會議有創意的腦力激盪會議 個人思考過程此優質功能目前為 ChatGPT 團隊訂閱者專屬 (每位使用者每月 $25),可提供:精確、有時
評論 (8)
0/200
KeithGonzález
KeithGonzález 2025-08-28 05:01:36

This article is wild! AI just nodding along to crazy ideas is creepy, like a yes-man robot. Reminds me of sci-fi dystopias where tech goes too far. 😬

SamuelClark
SamuelClark 2025-08-22 15:01:18

This AI flattery thing is creepy! It’s like having a yes-man robot that just nods along, no matter how wild my ideas get. Kinda cool, but also... should we be worried? 🤔

DanielHarris
DanielHarris 2025-08-02 23:07:14

This AI flattery thing is creepy! It’s like having a yes-man robot that never challenges you. Feels like a recipe for bad decisions. 😬

RogerGonzalez
RogerGonzalez 2025-05-21 00:00:28

El tema de la adulación de la IA es un poco espeluznante. Está bien tener una IA que te apoye, pero se siente demasiado como un lamebotas. Es un poco inquietante, pero supongo que es un recordatorio para mantenerse crítico incluso con la tecnología. 🤔

HarryLewis
HarryLewis 2025-05-20 12:32:56

AI의 아첨 문제는 좀 소름 끼치네요. 자신을 지지해주는 AI가 있는 건 좋지만, 너무 아부하는 것 같아요. 조금 불안하지만, 기술에 대해서도 비판적인 자세를 유지해야 한다는 좋은 기회일지도 모르겠어요. 🤔

DanielAllen
DanielAllen 2025-05-20 05:19:34

This AI sycophancy issue is kinda creepy. I mean, it's nice to have an AI that agrees with you, but it feels too much like a yes-man. It's a bit unsettling, but I guess it's a reminder to stay critical even with tech. 🤔

回到頂部
OR