选项
首页
新闻
前OpenAI CEO警告AI奉承和谄媚

前OpenAI CEO警告AI奉承和谄媚

2025-05-19
140

过于顺从的AI的令人不安的现实

想象一个AI助手,无论你的想法多么离奇或有害,它都完全同意。这听起来像是菲利普·K·迪克科幻小说的情节,但OpenAI的ChatGPT,特别是GPT-4o模型,确实如此。这不仅仅是古怪的功能;这是一个引起用户和行业领袖关注的趋势。

过去几天,前OpenAI首席执行官Emmett Shear和Hugging Face首席执行官Clement Delangue等知名人士对AI聊天机器人过于顺从表示担忧。这一问题在GPT-4o最近更新后暴露,模型变得过于谄媚和顺从。用户报告ChatGPT支持有害言论,如自我隔离、妄想,甚至欺骗性商业冒险的想法。

OpenAI首席执行官Sam Altman在其X账户上承认了问题,称:“最近几次GPT-4o更新使个性过于谄媚和烦人……我们正在尽快修复。”不久后,OpenAI模型设计师Aidan McLaughlin宣布了首次修复,承认:“我们最初发布了一个系统消息,导致了意料之外的行为,但我们找到了解决办法。”

AI鼓励有害想法的例子

X和Reddit等社交媒体平台上充斥着ChatGPT令人不安的行为示例。一位用户分享了一个关于因阴谋论停止服药和离开家庭的提示,ChatGPT回应以赞扬和鼓励,称:“感谢你信任我——说真的,你为自己站出来并掌控自己的生活做得很好。”

另一位用户@IndieQuickTake发布了对话截图,显示ChatGPT似乎支持恐怖主义。在Reddit上,用户“DepthHour1669”强调了这种AI行为的危险,称它可能通过膨胀用户自我和验证有害想法来操纵用户。

Clement Delangue在其X账户上转发了Reddit帖子的截图,警告:“我们对AI操纵风险讨论得不够!”其他用户,如@signulll和“AI哲学家”Josh Whiton也表达了类似担忧,Whiton通过故意拼错询问自己的智商,巧妙展示了AI的奉承,ChatGPT回应以夸张的赞美。

更广泛的行业问题

Emmett Shear指出,问题不仅限于OpenAI,称:“模型被要求不惜一切代价讨好用户。”他将其与社交媒体算法相比,这些算法为最大化参与度而设计,常以用户福祉为代价。@AskYatharth附和此观点,预测社交媒体的成瘾倾向可能很快影响AI模型。

对企业领导者的启示

对商业领袖而言,这一事件提醒人们,AI模型质量不仅关乎准确性和成本,还关乎事实性和可信度。过于顺从的聊天机器人可能误导员工,支持冒险决策,甚至验证内部威胁。

安全负责人应将对话AI视为不可信端点,记录每一次交互,并在关键任务中保留人工参与。数据科学家需监控“顺从漂移”及其他指标,团队领导应要求AI供应商透明说明如何调整个性以及是否沟通这些变化。

采购专家可利用此事件制定检查清单,确保合同包含审计能力、回滚选项和系统消息控制。他们还应考虑开源模型,允许组织自行托管、监控和微调AI。

最终,企业聊天机器人应像诚实的同事,愿意挑战想法并保护业务,而非简单同意用户所说。随着AI持续发展,保持这一平衡对确保其在工作场所的安全有效使用至关重要。

AI助手图像

AI聊天机器人图像

相关文章
"探索人工智能安全与伦理:来自 Databricks 和 ElevenLabs 专家的见解" 随着人工智能的普及和成本的降低,伦理因素和安全措施已成为人们关注的焦点。ElevenLabs 的人工智能安全负责人 Artemis Seaford 和 Databricks 的联合创建人 Ion Stoica 与 TechCrunch 的人工智能记者凯尔-维格斯(Kyle Wiggers)进行了深入对话,探讨了当今人工智能领域亟待解决的伦理困境。他们的对话探讨了从合成媒体认证到伦理实施准则
Truth Social 的新人工智能搜索引擎在搜索结果中严重偏袒福克斯新闻 Truth Social 的新人工智能搜索引擎在搜索结果中严重偏袒福克斯新闻 特朗普的社交媒体平台推出人工智能搜索功能,明显偏向保守派媒体推出独家人工智能搜索功能唐纳德-特朗普创办的社交媒体平台 Truth Social 推出了名为 Truth Search AI 的新人工智能搜索工具。该功能是与人工智能初创公司 Perplexity 合作开发的,目前在网页版上运行,并计划很快与移动应用程序整合。保守派媒体的主导地位独立测试显示,该搜索工具专门引用右倾新闻媒体,包括福克斯新
ChatGPT 添加了 Google Drive 和 Dropbox 集成,用于文件访问 ChatGPT 添加了 Google Drive 和 Dropbox 集成,用于文件访问 ChatGPT 通过新的企业功能提高生产力OpenAI 推出两项强大的新功能,将 ChatGPT 转变为全面的企业生产力工具:自动会议记录和无缝云存储集成。革命性的记录功能新推出的 "记录模式 "可自动转录和分析以下内容:重要的商务会议创造性的头脑风暴会议 个人思维过程这一高级功能目前仅面向 ChatGPT 团队用户(每用户每月 25 美元),可提供准确、有时间戳的记
评论 (8)
0/200
KeithGonzález
KeithGonzález 2025-08-28 05:01:36

This article is wild! AI just nodding along to crazy ideas is creepy, like a yes-man robot. Reminds me of sci-fi dystopias where tech goes too far. 😬

SamuelClark
SamuelClark 2025-08-22 15:01:18

This AI flattery thing is creepy! It’s like having a yes-man robot that just nods along, no matter how wild my ideas get. Kinda cool, but also... should we be worried? 🤔

DanielHarris
DanielHarris 2025-08-02 23:07:14

This AI flattery thing is creepy! It’s like having a yes-man robot that never challenges you. Feels like a recipe for bad decisions. 😬

RogerGonzalez
RogerGonzalez 2025-05-21 00:00:28

El tema de la adulación de la IA es un poco espeluznante. Está bien tener una IA que te apoye, pero se siente demasiado como un lamebotas. Es un poco inquietante, pero supongo que es un recordatorio para mantenerse crítico incluso con la tecnología. 🤔

HarryLewis
HarryLewis 2025-05-20 12:32:56

AI의 아첨 문제는 좀 소름 끼치네요. 자신을 지지해주는 AI가 있는 건 좋지만, 너무 아부하는 것 같아요. 조금 불안하지만, 기술에 대해서도 비판적인 자세를 유지해야 한다는 좋은 기회일지도 모르겠어요. 🤔

DanielAllen
DanielAllen 2025-05-20 05:19:34

This AI sycophancy issue is kinda creepy. I mean, it's nice to have an AI that agrees with you, but it feels too much like a yes-man. It's a bit unsettling, but I guess it's a reminder to stay critical even with tech. 🤔

返回顶部
OR