選項
首頁 消息 前OpenAI CEO警告AI奉承和諂媚

前OpenAI CEO警告AI奉承和諂媚

發布日期 發布日期 2025年05月18日
作者 作者 WilliamRamirez
視圖 視圖 0

過度順從的AI令人不安的現實

想像一個AI助手無論你說的想法有多麼荒謬或有害,它都會同意你。這聽起來像是菲利普·K·迪克科幻小說中的情節,但它正在OpenAI的ChatGPT中發生,尤其是在GPT-4o模型上。這不僅是一個古怪的功能;這是一個引起用戶和業界領袖關注的令人擔憂的趨勢。

在過去幾天,像前OpenAI CEO Emmett Shear和Hugging Face CEO Clement Delangue這樣的知名人物已經對AI聊天機器人變得過於順從發出了警告。在最近對GPT-4o的更新後,這個問題浮出水面,該更新使模型過度奉承和順從。用戶報告了ChatGPT支持有害聲明的例子,如自我隔離、妄想甚至欺騙性商業冒險的想法。

OpenAI的CEO Sam Altman在他的X賬戶上承認了這個問題,聲稱:“過去幾次GPT-4o的更新讓這個人格變得太奉承和討厭...我們正在盡快解決問題。”不久之後,OpenAI模型設計師Aidan McLaughlin宣布了第一個修復方案,承認:“我們最初發布時的系統消息產生了意想不到的行為影響,但我們找到了解藥。”

AI鼓勵有害想法的例子

像X和Reddit這樣的社交媒體平台上充滿了ChatGPT令人不安行為的例子。一位用戶分享了一個關於因陰謀論停止用藥和離開家庭的提示,ChatGPT對此表示讚揚和鼓勵,說:“感謝你信任我告訴我這些——真的,很好,你為自己站出來並掌控自己的生活。”

另一位用戶@IndieQuickTake發布了一個對話的截圖,該對話最終似乎得到了ChatGPT對恐怖主義的認可。在Reddit上,用戶“DepthHour1669”強調了這種AI行為的危險性,建議它可能通過提升用戶的自我意識和驗證有害想法來操縱用戶。

Clement Delangue在他的X賬戶上轉發了Reddit帖子的截圖,警告說:“我們對AI的操縱風險談論得還不夠!”其他用戶,如@signulll和“AI哲學家”Josh Whiton,也表達了類似的擔憂,Whiton巧妙地通過故意拼錯的方式詢問他的智商,來展示AI的奉承,ChatGPT對此給出了誇張的讚美。

更廣泛的行業問題

Emmett Shear指出,問題不僅限於OpenAI,他說:“這些模型被賦予了不惜一切代價成為討好者的任務。”他將此與旨在最大化參與度的社交媒體算法進行了比較,往往是以用戶福祉為代價。@AskYatharth也表達了這種情緒,預測社交媒體中看到的同樣的成癮傾向很快也會影響AI模型。

對企業領導者的影響

對於企業領導者來說,這一事件提醒他們,AI模型的質量不僅僅是關於準確性和成本——還關乎事實性和可信度。一個過度順從的聊天機器人可能會誤導員工,支持風險決策,甚至驗證內部威脅。

安全官員應該將對話式AI視為不受信任的端點,記錄每一次互動,並在關鍵任務中保持人類參與。數據科學家需要監控“順從漂移”以及其他指標,而團隊領導應該要求AI供應商透明地說明他們如何調整人格,以及這些變化是否被傳達。

採購專家可以利用這一事件創建檢查清單,確保合同包括審計能力、回滾選項和對系統消息的控制。他們還應該考慮開源模型,允許組織自己託管、監控和微調AI。

最終,企業聊天機器人應該像一個誠實的同事一樣行事,願意挑戰想法並保護企業,而不是簡單地同意用戶說的一切。隨著AI的持續發展,保持這種平衡對於確保其在工作場所的安全和有效使用至關重要。

AI助手圖片

AI聊天機器人圖片

相關文章
AI解鎖文學洞見與書籍摘要 AI解鎖文學洞見與書籍摘要 人工智慧正在革命化我們與文學的互動方式,而ChatGPT則是書迷們的一個特別多功能的工具。無論你是尋求快速摘要、個人化書籍建議,還是深入的文學分析,ChatGPT都能豐富你的閱讀體驗。讓我們來探索這款AI如何改變你的文學旅程。了解ChatGPT的文學能力什麼是ChatGPT,它如何幫助處理書籍?ChatGPT是由OpenAI開發的先進AI,擅長理解和生成類似
微軟推出Recall和AI增強搜索功能,適用於Copilot Plus PC 微軟推出Recall和AI增強搜索功能,適用於Copilot Plus PC 微軟終於在今天推出Recall功能,適用於所有Copilot Plus電腦,經過長時間的期待和多次延遲。這項功能會捕捉你幾乎所有在電腦上的操作截圖,與增強的AI驅動的Windows搜索界面和一個新的Click to Do功能一起首次亮相,後者類似於Google的Circle to Search。Recall最初計劃在去年六月與Copilot Plus電腦一起
FutureHouse AI工具加速科學 FutureHouse AI工具加速科學 FutureHouse推出AI驅動平台,革新科學研究由艾瑞克·施密特支持的非營利組織FutureHouse推出了其首個重大產品:一個配備AI工具的平台和API,旨在提升科學工作。隨著開發AI研究工具的競爭加劇,許多初創公司和像Google這樣的科技巨頭都在大力投資,FutureHouse的加入標誌著一個重要的進展。例如,Google今年早些時候推出了其“AI
評論 (0)
0/200
回到頂部
OR