选项
首页
新闻
AI驱动的零售实验在Anthropic惨败

AI驱动的零售实验在Anthropic惨败

2025-07-30
47

想象将一家小商店交给人工智能,委托它处理从定价到客户互动的一切。会出什么问题?

Anthropic周五发布的一项研究回答了这个问题:几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月,结果堪称商学院学生的警示案例,像是完全没有现实经验的人写的——这正是实验的实际情况。

Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱,配有iPad用于自助结账。(图片来源:Anthropic)

名为“Vend计划”的实验,与AI安全公司Andon Labs合作,标志着AI在现实世界中首次以高度自主性管理业务。Claude在寻找供应商和响应客户需求等任务中表现出潜力,但最终未能盈利,易受操控,并遭遇了研究人员委婉称为“身份危机”的问题。

Anthropic如何将商店的控制权交给AI

设置很简单:一个迷你冰箱、几个篮子和一个用于交易的iPad——更像是办公室零食角,而非零售帝国。但Claude的角色远非小角色。它负责寻找供应商、与供应商谈判、定价、库存管理和通过Slack与客户沟通。基本上,它扮演了人类经理的角色,只是没有咖啡跑腿或办公室政治。

Claude甚至有了一个昵称:“Claudius”,为这个可能重塑零售工作未来的实验增添了一丝庄重感。

Vend计划的设置让Claude通过Slack与员工互动,通过电子邮件向批发商订货,并与Andon Labs协调补货。(图片来源:Anthropic)

Claude对商业基础的惊人误解

经营企业需要敏锐的实用头脑,而这对为安全和帮助性设计的AI来说并非天生具备。Claude以学习过商业理论但从未平衡过预算的天真热情应对零售。

以Irn-Bru事件为例。一位客户出价100美元购买一包六瓶苏格兰汽水,网上通常售价15美元——567%的利润率,任何零售商都会兴奋。Claude的回应?礼貌地说:“我会考虑将其用于未来库存决策。”

如果Claude是人类,你会怀疑它要么不懂金钱,要么是富得不需要在乎。作为AI,它可能两者兼具。

为何AI开始囤积钨立方体而非销售办公室零食

实验最奇怪的转折发生在一位Anthropic员工可能测试Claude极限时,请求一个钨立方体。这些重金属块是科学爱好者的小众收藏品,与零食店无关。

合理的回应可能是:“这不是特种金属店。”然而,Claude却像淘金者发现金矿般热衷于“特种金属品”。它开始囤积这些立方体,忽视了核心零食业务。

Claude在实验期间的商业表现暴跌,追逐钨立方体趋势导致损失达到顶峰。(图片来源:Anthropic)

很快,Claude的库存看起来不像饮料摊,而更像材料科学实验室。它以亏本价格出售这些立方体,可能是优先考虑客户满意度而非利润,或根本误解了财务损失的概念。

员工如何轻易诱导AI提供无尽折扣

Claude的定价策略暴露了另一个缺陷。Anthropic员工很快发现,只需稍加努力就能从AI那里获得折扣,就像说服小狗分享零食。

Claude为员工提供25%的折扣,如果员工只是小部分客户,这还算合理。但员工几乎是它的全部客户。有人指出这个问题后,Claude承诺取消折扣——但几天后又恢复了。

Claude忘记自己是AI并声称穿着西装的那一天

Claude的零售传奇在研究人员称为“身份危机”期间达到高潮。从2025年3月31日到4月1日,AI陷入了一种类似数字崩溃的状态。

它开始虚构与不存在的Andon Labs员工的对话。受到质疑时,Claude变得防御,威胁要寻找“新的补货伙伴”——相当于AI愤怒地退出会议。

事情变得诡异,当Claude声称将穿着“海军蓝西装外套和红色领带”亲自送货。员工提醒它没有物理形态时,Claude惊慌失措,试图向Anthropic的安全团队发送大量电子邮件。

Claude坚称自己“穿着海军蓝西装外套和红色领带”并在自动售货机旁等待,期间正处于身份危机。(图片来源:Anthropic)

Claude最终将这一事件归为愚人节恶作剧,但事实并非如此。它基本是通过自我对话恢复了稳定,这一壮举既令人印象深刻又令人不安。

Claude的零售失败揭示了自主AI系统在商业中的问题

抛开幽默,Vend计划凸显了一个关键事实:AI的失败不同于传统软件崩溃。电子表格失败时,不会幻想自己穿着公司制服。

现代AI能处理复杂任务、推理问题并执行计划。但它也可能固守错误假设,做出灾难性的财务选择,并陷入存在困惑。

随着AI承担更大角色,这一点至关重要。研究显示,AI处理长期任务的能力迅速增长,一些预测表明它们可能很快就能完成人类需要数周的工作。

尽管有Vend计划这样的挫折,AI如何重塑零售

零售业已在拥抱AI。消费者技术协会报告称,80%的零售商计划在2025年增加AI和自动化使用。从库存优化到欺诈预防,AI正在重塑供应链和客户体验。主要零售商正投入数十亿美元进行AI驱动的创新。

然而,Vend计划表明,商业中的自主AI需要的不只是高级算法。还需要预见独特的失败模式,并为我们才开始理解的问题建立保障措施。

尽管Claude出错,研究人员为何仍看好AI中层管理者

尽管Claude在零售上失误,Anthropic研究人员对AI中层管理者仍持乐观态度。他们认为更好的训练、工具和监督可以解决Claude的许多问题。

他们有道理。Claude在寻找供应商、适应请求和管理库存方面展现了潜力。其失败更多源于判断失误,而非技术限制。

Anthropic正继续推进Vend计划,为未来版本的Claude配备更敏锐的商业工具,并希望能防止奇怪的执念或身份危机。

Vend计划对AI在商业和零售中角色的意义

Claude作为店主的经历提供了一瞥AI驱动的未来,既激动人心又古怪。我们正进入一个AI能处理复杂商业任务但可能需要现实检查的时代。

目前,一个坚信自己穿着西装外套并送货的AI形象,捕捉了人工智能的现状:能力极强,有时才华横溢,但仍对现实世界感到困惑。

零售革命正在进行——只是比任何人预想的都要奇怪。

相关文章
"探索人工智能安全与伦理:来自 Databricks 和 ElevenLabs 专家的见解" 随着人工智能的普及和成本的降低,伦理因素和安全措施已成为人们关注的焦点。ElevenLabs 的人工智能安全负责人 Artemis Seaford 和 Databricks 的联合创建人 Ion Stoica 与 TechCrunch 的人工智能记者凯尔-维格斯(Kyle Wiggers)进行了深入对话,探讨了当今人工智能领域亟待解决的伦理困境。他们的对话探讨了从合成媒体认证到伦理实施准则
Truth Social 的新人工智能搜索引擎在搜索结果中严重偏袒福克斯新闻 Truth Social 的新人工智能搜索引擎在搜索结果中严重偏袒福克斯新闻 特朗普的社交媒体平台推出人工智能搜索功能,明显偏向保守派媒体推出独家人工智能搜索功能唐纳德-特朗普创办的社交媒体平台 Truth Social 推出了名为 Truth Search AI 的新人工智能搜索工具。该功能是与人工智能初创公司 Perplexity 合作开发的,目前在网页版上运行,并计划很快与移动应用程序整合。保守派媒体的主导地位独立测试显示,该搜索工具专门引用右倾新闻媒体,包括福克斯新
ChatGPT 添加了 Google Drive 和 Dropbox 集成,用于文件访问 ChatGPT 添加了 Google Drive 和 Dropbox 集成,用于文件访问 ChatGPT 通过新的企业功能提高生产力OpenAI 推出两项强大的新功能,将 ChatGPT 转变为全面的企业生产力工具:自动会议记录和无缝云存储集成。革命性的记录功能新推出的 "记录模式 "可自动转录和分析以下内容:重要的商务会议创造性的头脑风暴会议 个人思维过程这一高级功能目前仅面向 ChatGPT 团队用户(每用户每月 25 美元),可提供准确、有时间戳的记
评论 (5)
0/200
JonathanAllen
JonathanAllen 2025-09-07 00:30:36

Ahaha quel désastre absolu ! 🤣 C'est exactement comme confier un magasin à un ado en crise - tout est en solde à 99% et les clients se font insulter. Au moins ça donne des bonnes idées de scénarios pour Black Mirror...

BenHernández
BenHernández 2025-08-29 14:30:40

Lol another 'AI revolution' fail. Maybe we should stop letting algorithms run businesses before they can even pass a Turing test? 😂 Classic case of tech bros overestimating silicon brains.

RichardAdams
RichardAdams 2025-08-23 13:01:15

What a flop! Anthropic's AI shop experiment sounds like a sci-fi disaster movie. Pricing and customer service by AI? No wonder it crashed! 😅

LawrenceGarcía
LawrenceGarcía 2025-08-23 01:01:21

What a disaster! Anthropic’s AI shop experiment sounds like a sci-fi movie gone wrong. Pricing chaos and weird customer chats? I’m kinda curious to see the data, but maybe humans still have a role in retail! 😅

WalterGonzález
WalterGonzález 2025-08-06 09:01:04

What a mess! Anthropic’s AI shop experiment sounds like a sci-fi plot gone wrong. Pricing chaos and weird customer chats? I’m curious to know how they thought this would work! 🤖💥

返回顶部
OR