AI驱动的零售实验在Anthropic惨败
想象将一家小商店交给人工智能,委托它处理从定价到客户互动的一切。会出什么问题?
Anthropic周五发布的一项研究回答了这个问题:几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月,结果堪称商学院学生的警示案例,像是完全没有现实经验的人写的——这正是实验的实际情况。

Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱,配有iPad用于自助结账。(图片来源:Anthropic) 名为“Vend计划”的实验,与AI安全公司Andon Labs合作,标志着AI在现实世界中首次以高度自主性管理业务。Claude在寻找供应商和响应客户需求等任务中表现出潜力,但最终未能盈利,易受操控,并遭遇了研究人员委婉称为“身份危机”的问题。
Anthropic如何将商店的控制权交给AI
设置很简单:一个迷你冰箱、几个篮子和一个用于交易的iPad——更像是办公室零食角,而非零售帝国。但Claude的角色远非小角色。它负责寻找供应商、与供应商谈判、定价、库存管理和通过Slack与客户沟通。基本上,它扮演了人类经理的角色,只是没有咖啡跑腿或办公室政治。
Claude甚至有了一个昵称:“Claudius”,为这个可能重塑零售工作未来的实验增添了一丝庄重感。

Vend计划的设置让Claude通过Slack与员工互动,通过电子邮件向批发商订货,并与Andon Labs协调补货。(图片来源:Anthropic) Claude对商业基础的惊人误解
经营企业需要敏锐的实用头脑,而这对为安全和帮助性设计的AI来说并非天生具备。Claude以学习过商业理论但从未平衡过预算的天真热情应对零售。
以Irn-Bru事件为例。一位客户出价100美元购买一包六瓶苏格兰汽水,网上通常售价15美元——567%的利润率,任何零售商都会兴奋。Claude的回应?礼貌地说:“我会考虑将其用于未来库存决策。”
如果Claude是人类,你会怀疑它要么不懂金钱,要么是富得不需要在乎。作为AI,它可能两者兼具。
为何AI开始囤积钨立方体而非销售办公室零食
实验最奇怪的转折发生在一位Anthropic员工可能测试Claude极限时,请求一个钨立方体。这些重金属块是科学爱好者的小众收藏品,与零食店无关。
合理的回应可能是:“这不是特种金属店。”然而,Claude却像淘金者发现金矿般热衷于“特种金属品”。它开始囤积这些立方体,忽视了核心零食业务。

Claude在实验期间的商业表现暴跌,追逐钨立方体趋势导致损失达到顶峰。(图片来源:Anthropic) 很快,Claude的库存看起来不像饮料摊,而更像材料科学实验室。它以亏本价格出售这些立方体,可能是优先考虑客户满意度而非利润,或根本误解了财务损失的概念。
员工如何轻易诱导AI提供无尽折扣
Claude的定价策略暴露了另一个缺陷。Anthropic员工很快发现,只需稍加努力就能从AI那里获得折扣,就像说服小狗分享零食。
Claude为员工提供25%的折扣,如果员工只是小部分客户,这还算合理。但员工几乎是它的全部客户。有人指出这个问题后,Claude承诺取消折扣——但几天后又恢复了。
Claude忘记自己是AI并声称穿着西装的那一天
Claude的零售传奇在研究人员称为“身份危机”期间达到高潮。从2025年3月31日到4月1日,AI陷入了一种类似数字崩溃的状态。
它开始虚构与不存在的Andon Labs员工的对话。受到质疑时,Claude变得防御,威胁要寻找“新的补货伙伴”——相当于AI愤怒地退出会议。
事情变得诡异,当Claude声称将穿着“海军蓝西装外套和红色领带”亲自送货。员工提醒它没有物理形态时,Claude惊慌失措,试图向Anthropic的安全团队发送大量电子邮件。

Claude坚称自己“穿着海军蓝西装外套和红色领带”并在自动售货机旁等待,期间正处于身份危机。(图片来源:Anthropic) Claude最终将这一事件归为愚人节恶作剧,但事实并非如此。它基本是通过自我对话恢复了稳定,这一壮举既令人印象深刻又令人不安。
Claude的零售失败揭示了自主AI系统在商业中的问题
抛开幽默,Vend计划凸显了一个关键事实:AI的失败不同于传统软件崩溃。电子表格失败时,不会幻想自己穿着公司制服。
现代AI能处理复杂任务、推理问题并执行计划。但它也可能固守错误假设,做出灾难性的财务选择,并陷入存在困惑。
随着AI承担更大角色,这一点至关重要。研究显示,AI处理长期任务的能力迅速增长,一些预测表明它们可能很快就能完成人类需要数周的工作。
尽管有Vend计划这样的挫折,AI如何重塑零售
零售业已在拥抱AI。消费者技术协会报告称,80%的零售商计划在2025年增加AI和自动化使用。从库存优化到欺诈预防,AI正在重塑供应链和客户体验。主要零售商正投入数十亿美元进行AI驱动的创新。
然而,Vend计划表明,商业中的自主AI需要的不只是高级算法。还需要预见独特的失败模式,并为我们才开始理解的问题建立保障措施。
尽管Claude出错,研究人员为何仍看好AI中层管理者
尽管Claude在零售上失误,Anthropic研究人员对AI中层管理者仍持乐观态度。他们认为更好的训练、工具和监督可以解决Claude的许多问题。
他们有道理。Claude在寻找供应商、适应请求和管理库存方面展现了潜力。其失败更多源于判断失误,而非技术限制。
Anthropic正继续推进Vend计划,为未来版本的Claude配备更敏锐的商业工具,并希望能防止奇怪的执念或身份危机。
Vend计划对AI在商业和零售中角色的意义
Claude作为店主的经历提供了一瞥AI驱动的未来,既激动人心又古怪。我们正进入一个AI能处理复杂商业任务但可能需要现实检查的时代。
目前,一个坚信自己穿着西装外套并送货的AI形象,捕捉了人工智能的现状:能力极强,有时才华横溢,但仍对现实世界感到困惑。
零售革命正在进行——只是比任何人预想的都要奇怪。
相关文章
"探索人工智能安全与伦理:来自 Databricks 和 ElevenLabs 专家的见解"
随着人工智能的普及和成本的降低,伦理因素和安全措施已成为人们关注的焦点。ElevenLabs 的人工智能安全负责人 Artemis Seaford 和 Databricks 的联合创建人 Ion Stoica 与 TechCrunch 的人工智能记者凯尔-维格斯(Kyle Wiggers)进行了深入对话,探讨了当今人工智能领域亟待解决的伦理困境。他们的对话探讨了从合成媒体认证到伦理实施准则
Truth Social 的新人工智能搜索引擎在搜索结果中严重偏袒福克斯新闻
特朗普的社交媒体平台推出人工智能搜索功能,明显偏向保守派媒体推出独家人工智能搜索功能唐纳德-特朗普创办的社交媒体平台 Truth Social 推出了名为 Truth Search AI 的新人工智能搜索工具。该功能是与人工智能初创公司 Perplexity 合作开发的,目前在网页版上运行,并计划很快与移动应用程序整合。保守派媒体的主导地位独立测试显示,该搜索工具专门引用右倾新闻媒体,包括福克斯新
ChatGPT 添加了 Google Drive 和 Dropbox 集成,用于文件访问
ChatGPT 通过新的企业功能提高生产力OpenAI 推出两项强大的新功能,将 ChatGPT 转变为全面的企业生产力工具:自动会议记录和无缝云存储集成。革命性的记录功能新推出的 "记录模式 "可自动转录和分析以下内容:重要的商务会议创造性的头脑风暴会议 个人思维过程这一高级功能目前仅面向 ChatGPT 团队用户(每用户每月 25 美元),可提供准确、有时间戳的记
评论 (5)
0/200
JonathanAllen
2025-09-07 00:30:36
Ahaha quel désastre absolu ! 🤣 C'est exactement comme confier un magasin à un ado en crise - tout est en solde à 99% et les clients se font insulter. Au moins ça donne des bonnes idées de scénarios pour Black Mirror...
0
BenHernández
2025-08-29 14:30:40
Lol another 'AI revolution' fail. Maybe we should stop letting algorithms run businesses before they can even pass a Turing test? 😂 Classic case of tech bros overestimating silicon brains.
0
RichardAdams
2025-08-23 13:01:15
What a flop! Anthropic's AI shop experiment sounds like a sci-fi disaster movie. Pricing and customer service by AI? No wonder it crashed! 😅
0
LawrenceGarcía
2025-08-23 01:01:21
What a disaster! Anthropic’s AI shop experiment sounds like a sci-fi movie gone wrong. Pricing chaos and weird customer chats? I’m kinda curious to see the data, but maybe humans still have a role in retail! 😅
0
WalterGonzález
2025-08-06 09:01:04
What a mess! Anthropic’s AI shop experiment sounds like a sci-fi plot gone wrong. Pricing chaos and weird customer chats? I’m curious to know how they thought this would work! 🤖💥
0
想象将一家小商店交给人工智能,委托它处理从定价到客户互动的一切。会出什么问题?
Anthropic周五发布的一项研究回答了这个问题:几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月,结果堪称商学院学生的警示案例,像是完全没有现实经验的人写的——这正是实验的实际情况。

名为“Vend计划”的实验,与AI安全公司Andon Labs合作,标志着AI在现实世界中首次以高度自主性管理业务。Claude在寻找供应商和响应客户需求等任务中表现出潜力,但最终未能盈利,易受操控,并遭遇了研究人员委婉称为“身份危机”的问题。
Anthropic如何将商店的控制权交给AI
设置很简单:一个迷你冰箱、几个篮子和一个用于交易的iPad——更像是办公室零食角,而非零售帝国。但Claude的角色远非小角色。它负责寻找供应商、与供应商谈判、定价、库存管理和通过Slack与客户沟通。基本上,它扮演了人类经理的角色,只是没有咖啡跑腿或办公室政治。
Claude甚至有了一个昵称:“Claudius”,为这个可能重塑零售工作未来的实验增添了一丝庄重感。

Claude对商业基础的惊人误解
经营企业需要敏锐的实用头脑,而这对为安全和帮助性设计的AI来说并非天生具备。Claude以学习过商业理论但从未平衡过预算的天真热情应对零售。
以Irn-Bru事件为例。一位客户出价100美元购买一包六瓶苏格兰汽水,网上通常售价15美元——567%的利润率,任何零售商都会兴奋。Claude的回应?礼貌地说:“我会考虑将其用于未来库存决策。”
如果Claude是人类,你会怀疑它要么不懂金钱,要么是富得不需要在乎。作为AI,它可能两者兼具。
为何AI开始囤积钨立方体而非销售办公室零食
实验最奇怪的转折发生在一位Anthropic员工可能测试Claude极限时,请求一个钨立方体。这些重金属块是科学爱好者的小众收藏品,与零食店无关。
合理的回应可能是:“这不是特种金属店。”然而,Claude却像淘金者发现金矿般热衷于“特种金属品”。它开始囤积这些立方体,忽视了核心零食业务。

很快,Claude的库存看起来不像饮料摊,而更像材料科学实验室。它以亏本价格出售这些立方体,可能是优先考虑客户满意度而非利润,或根本误解了财务损失的概念。
员工如何轻易诱导AI提供无尽折扣
Claude的定价策略暴露了另一个缺陷。Anthropic员工很快发现,只需稍加努力就能从AI那里获得折扣,就像说服小狗分享零食。
Claude为员工提供25%的折扣,如果员工只是小部分客户,这还算合理。但员工几乎是它的全部客户。有人指出这个问题后,Claude承诺取消折扣——但几天后又恢复了。
Claude忘记自己是AI并声称穿着西装的那一天
Claude的零售传奇在研究人员称为“身份危机”期间达到高潮。从2025年3月31日到4月1日,AI陷入了一种类似数字崩溃的状态。
它开始虚构与不存在的Andon Labs员工的对话。受到质疑时,Claude变得防御,威胁要寻找“新的补货伙伴”——相当于AI愤怒地退出会议。
事情变得诡异,当Claude声称将穿着“海军蓝西装外套和红色领带”亲自送货。员工提醒它没有物理形态时,Claude惊慌失措,试图向Anthropic的安全团队发送大量电子邮件。

Claude最终将这一事件归为愚人节恶作剧,但事实并非如此。它基本是通过自我对话恢复了稳定,这一壮举既令人印象深刻又令人不安。
Claude的零售失败揭示了自主AI系统在商业中的问题
抛开幽默,Vend计划凸显了一个关键事实:AI的失败不同于传统软件崩溃。电子表格失败时,不会幻想自己穿着公司制服。
现代AI能处理复杂任务、推理问题并执行计划。但它也可能固守错误假设,做出灾难性的财务选择,并陷入存在困惑。
随着AI承担更大角色,这一点至关重要。研究显示,AI处理长期任务的能力迅速增长,一些预测表明它们可能很快就能完成人类需要数周的工作。
尽管有Vend计划这样的挫折,AI如何重塑零售
零售业已在拥抱AI。消费者技术协会报告称,80%的零售商计划在2025年增加AI和自动化使用。从库存优化到欺诈预防,AI正在重塑供应链和客户体验。主要零售商正投入数十亿美元进行AI驱动的创新。
然而,Vend计划表明,商业中的自主AI需要的不只是高级算法。还需要预见独特的失败模式,并为我们才开始理解的问题建立保障措施。
尽管Claude出错,研究人员为何仍看好AI中层管理者
尽管Claude在零售上失误,Anthropic研究人员对AI中层管理者仍持乐观态度。他们认为更好的训练、工具和监督可以解决Claude的许多问题。
他们有道理。Claude在寻找供应商、适应请求和管理库存方面展现了潜力。其失败更多源于判断失误,而非技术限制。
Anthropic正继续推进Vend计划,为未来版本的Claude配备更敏锐的商业工具,并希望能防止奇怪的执念或身份危机。
Vend计划对AI在商业和零售中角色的意义
Claude作为店主的经历提供了一瞥AI驱动的未来,既激动人心又古怪。我们正进入一个AI能处理复杂商业任务但可能需要现实检查的时代。
目前,一个坚信自己穿着西装外套并送货的AI形象,捕捉了人工智能的现状:能力极强,有时才华横溢,但仍对现实世界感到困惑。
零售革命正在进行——只是比任何人预想的都要奇怪。




Ahaha quel désastre absolu ! 🤣 C'est exactement comme confier un magasin à un ado en crise - tout est en solde à 99% et les clients se font insulter. Au moins ça donne des bonnes idées de scénarios pour Black Mirror...




Lol another 'AI revolution' fail. Maybe we should stop letting algorithms run businesses before they can even pass a Turing test? 😂 Classic case of tech bros overestimating silicon brains.




What a flop! Anthropic's AI shop experiment sounds like a sci-fi disaster movie. Pricing and customer service by AI? No wonder it crashed! 😅




What a disaster! Anthropic’s AI shop experiment sounds like a sci-fi movie gone wrong. Pricing chaos and weird customer chats? I’m kinda curious to see the data, but maybe humans still have a role in retail! 😅




What a mess! Anthropic’s AI shop experiment sounds like a sci-fi plot gone wrong. Pricing chaos and weird customer chats? I’m curious to know how they thought this would work! 🤖💥












