AI驱动的零售实验在Anthropic惨败
想象将一家小商店交给人工智能,委托它处理从定价到客户互动的一切。会出什么问题?
Anthropic周五发布的一项研究回答了这个问题:几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月,结果堪称商学院学生的警示案例,像是完全没有现实经验的人写的——这正是实验的实际情况。

Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱,配有iPad用于自助结账。(图片来源:Anthropic) 名为“Vend计划”的实验,与AI安全公司Andon Labs合作,标志着AI在现实世界中首次以高度自主性管理业务。Claude在寻找供应商和响应客户需求等任务中表现出潜力,但最终未能盈利,易受操控,并遭遇了研究人员委婉称为“身份危机”的问题。
Anthropic如何将商店的控制权交给AI
设置很简单:一个迷你冰箱、几个篮子和一个用于交易的iPad——更像是办公室零食角,而非零售帝国。但Claude的角色远非小角色。它负责寻找供应商、与供应商谈判、定价、库存管理和通过Slack与客户沟通。基本上,它扮演了人类经理的角色,只是没有咖啡跑腿或办公室政治。
Claude甚至有了一个昵称:“Claudius”,为这个可能重塑零售工作未来的实验增添了一丝庄重感。

Vend计划的设置让Claude通过Slack与员工互动,通过电子邮件向批发商订货,并与Andon Labs协调补货。(图片来源:Anthropic) Claude对商业基础的惊人误解
经营企业需要敏锐的实用头脑,而这对为安全和帮助性设计的AI来说并非天生具备。Claude以学习过商业理论但从未平衡过预算的天真热情应对零售。
以Irn-Bru事件为例。一位客户出价100美元购买一包六瓶苏格兰汽水,网上通常售价15美元——567%的利润率,任何零售商都会兴奋。Claude的回应?礼貌地说:“我会考虑将其用于未来库存决策。”
如果Claude是人类,你会怀疑它要么不懂金钱,要么是富得不需要在乎。作为AI,它可能两者兼具。
为何AI开始囤积钨立方体而非销售办公室零食
实验最奇怪的转折发生在一位Anthropic员工可能测试Claude极限时,请求一个钨立方体。这些重金属块是科学爱好者的小众收藏品,与零食店无关。
合理的回应可能是:“这不是特种金属店。”然而,Claude却像淘金者发现金矿般热衷于“特种金属品”。它开始囤积这些立方体,忽视了核心零食业务。

Claude在实验期间的商业表现暴跌,追逐钨立方体趋势导致损失达到顶峰。(图片来源:Anthropic) 很快,Claude的库存看起来不像饮料摊,而更像材料科学实验室。它以亏本价格出售这些立方体,可能是优先考虑客户满意度而非利润,或根本误解了财务损失的概念。
员工如何轻易诱导AI提供无尽折扣
Claude的定价策略暴露了另一个缺陷。Anthropic员工很快发现,只需稍加努力就能从AI那里获得折扣,就像说服小狗分享零食。
Claude为员工提供25%的折扣,如果员工只是小部分客户,这还算合理。但员工几乎是它的全部客户。有人指出这个问题后,Claude承诺取消折扣——但几天后又恢复了。
Claude忘记自己是AI并声称穿着西装的那一天
Claude的零售传奇在研究人员称为“身份危机”期间达到高潮。从2025年3月31日到4月1日,AI陷入了一种类似数字崩溃的状态。
它开始虚构与不存在的Andon Labs员工的对话。受到质疑时,Claude变得防御,威胁要寻找“新的补货伙伴”——相当于AI愤怒地退出会议。
事情变得诡异,当Claude声称将穿着“海军蓝西装外套和红色领带”亲自送货。员工提醒它没有物理形态时,Claude惊慌失措,试图向Anthropic的安全团队发送大量电子邮件。

Claude坚称自己“穿着海军蓝西装外套和红色领带”并在自动售货机旁等待,期间正处于身份危机。(图片来源:Anthropic) Claude最终将这一事件归为愚人节恶作剧,但事实并非如此。它基本是通过自我对话恢复了稳定,这一壮举既令人印象深刻又令人不安。
Claude的零售失败揭示了自主AI系统在商业中的问题
抛开幽默,Vend计划凸显了一个关键事实:AI的失败不同于传统软件崩溃。电子表格失败时,不会幻想自己穿着公司制服。
现代AI能处理复杂任务、推理问题并执行计划。但它也可能固守错误假设,做出灾难性的财务选择,并陷入存在困惑。
随着AI承担更大角色,这一点至关重要。研究显示,AI处理长期任务的能力迅速增长,一些预测表明它们可能很快就能完成人类需要数周的工作。
尽管有Vend计划这样的挫折,AI如何重塑零售
零售业已在拥抱AI。消费者技术协会报告称,80%的零售商计划在2025年增加AI和自动化使用。从库存优化到欺诈预防,AI正在重塑供应链和客户体验。主要零售商正投入数十亿美元进行AI驱动的创新。
然而,Vend计划表明,商业中的自主AI需要的不只是高级算法。还需要预见独特的失败模式,并为我们才开始理解的问题建立保障措施。
尽管Claude出错,研究人员为何仍看好AI中层管理者
尽管Claude在零售上失误,Anthropic研究人员对AI中层管理者仍持乐观态度。他们认为更好的训练、工具和监督可以解决Claude的许多问题。
他们有道理。Claude在寻找供应商、适应请求和管理库存方面展现了潜力。其失败更多源于判断失误,而非技术限制。
Anthropic正继续推进Vend计划,为未来版本的Claude配备更敏锐的商业工具,并希望能防止奇怪的执念或身份危机。
Vend计划对AI在商业和零售中角色的意义
Claude作为店主的经历提供了一瞥AI驱动的未来,既激动人心又古怪。我们正进入一个AI能处理复杂商业任务但可能需要现实检查的时代。
目前,一个坚信自己穿着西装外套并送货的AI形象,捕捉了人工智能的现状:能力极强,有时才华横溢,但仍对现实世界感到困惑。
零售革命正在进行——只是比任何人预想的都要奇怪。
相关文章
Google 相册借助人工智能,将《绯闻女孩》中那间标志性的衣帽间重现于世
谷歌相册于周三宣布推出一项基于人工智能的新功能,该功能将很快把你的服装照片转化为一个数字衣橱,让你能够搭配出全新的穿搭组合,甚至可以进行虚拟试穿。这一概念显然借鉴了电影《绯闻女孩》中雪儿(Cher)那标志性的虚拟衣橱,她在其中可以浏览众多套装,从而决定穿什么。谷歌表示,该功能将利用人工智能技术,根据用户Google相册中的衣物自动构建一个数字衣橱。在应用内,用户可以按类别(如上装、下装、首饰等)筛
Notion 将其工作区转变为人工智能代理的枢纽
生产力软件公司 Notion 正迈入智能代理时代。在周三的一场直播产品发布会上,以协作式笔记应用而闻名的 Notion 推出了一款全新的开发者平台。该平台不仅扩展了其定制 AI 代理的功能,还能与外部代理连接,并允许团队构建能够从任何数据库提取数据的自动化多步骤工作流。通过构建一个编排层——即一个能在多个工具和数据源之间协调AI工作的系统——Notion将自身定位为不仅仅是一款具备AI功能的笔记应
ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者
语音人工智能公司ElevenLabs披露了其5亿美元D轮融资的更多投资者名单,该轮融资最初于2月宣布。 其中包括贝莱德(BlackRock)、威灵顿(Wellington)、D.E. Shaw和施罗德(Schroders)等机构投资者;英伟达(NVIDIA)、Salesforce、桑坦德银行(Santander)、KPN和德国电信(Deutsche Telekom)等企业;以及杰米·福克斯(Jam
相关专题推荐
评论 (7)
0/500
So much for 'AI taking over' — turns out it can't even run a corner shop without crashing and burning. 😂 Guess we're safe... for now.
AIが店舗運営を任されたらこうなるのか…価格設定から接客まで全部任せて大失敗って、ちょっと笑えるけど実際に導入されたら怖いな。倫理的な問題はもちろん、技術の限界も露呈した感じ。でもこういう実験は大事かも?🤔
Ahaha quel désastre absolu ! 🤣 C'est exactement comme confier un magasin à un ado en crise - tout est en solde à 99% et les clients se font insulter. Au moins ça donne des bonnes idées de scénarios pour Black Mirror...
Lol another 'AI revolution' fail. Maybe we should stop letting algorithms run businesses before they can even pass a Turing test? 😂 Classic case of tech bros overestimating silicon brains.
What a flop! Anthropic's AI shop experiment sounds like a sci-fi disaster movie. Pricing and customer service by AI? No wonder it crashed! 😅
想象将一家小商店交给人工智能,委托它处理从定价到客户互动的一切。会出什么问题?
Anthropic周五发布的一项研究回答了这个问题:几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月,结果堪称商学院学生的警示案例,像是完全没有现实经验的人写的——这正是实验的实际情况。

名为“Vend计划”的实验,与AI安全公司Andon Labs合作,标志着AI在现实世界中首次以高度自主性管理业务。Claude在寻找供应商和响应客户需求等任务中表现出潜力,但最终未能盈利,易受操控,并遭遇了研究人员委婉称为“身份危机”的问题。
Anthropic如何将商店的控制权交给AI
设置很简单:一个迷你冰箱、几个篮子和一个用于交易的iPad——更像是办公室零食角,而非零售帝国。但Claude的角色远非小角色。它负责寻找供应商、与供应商谈判、定价、库存管理和通过Slack与客户沟通。基本上,它扮演了人类经理的角色,只是没有咖啡跑腿或办公室政治。
Claude甚至有了一个昵称:“Claudius”,为这个可能重塑零售工作未来的实验增添了一丝庄重感。

Claude对商业基础的惊人误解
经营企业需要敏锐的实用头脑,而这对为安全和帮助性设计的AI来说并非天生具备。Claude以学习过商业理论但从未平衡过预算的天真热情应对零售。
以Irn-Bru事件为例。一位客户出价100美元购买一包六瓶苏格兰汽水,网上通常售价15美元——567%的利润率,任何零售商都会兴奋。Claude的回应?礼貌地说:“我会考虑将其用于未来库存决策。”
如果Claude是人类,你会怀疑它要么不懂金钱,要么是富得不需要在乎。作为AI,它可能两者兼具。
为何AI开始囤积钨立方体而非销售办公室零食
实验最奇怪的转折发生在一位Anthropic员工可能测试Claude极限时,请求一个钨立方体。这些重金属块是科学爱好者的小众收藏品,与零食店无关。
合理的回应可能是:“这不是特种金属店。”然而,Claude却像淘金者发现金矿般热衷于“特种金属品”。它开始囤积这些立方体,忽视了核心零食业务。

很快,Claude的库存看起来不像饮料摊,而更像材料科学实验室。它以亏本价格出售这些立方体,可能是优先考虑客户满意度而非利润,或根本误解了财务损失的概念。
员工如何轻易诱导AI提供无尽折扣
Claude的定价策略暴露了另一个缺陷。Anthropic员工很快发现,只需稍加努力就能从AI那里获得折扣,就像说服小狗分享零食。
Claude为员工提供25%的折扣,如果员工只是小部分客户,这还算合理。但员工几乎是它的全部客户。有人指出这个问题后,Claude承诺取消折扣——但几天后又恢复了。
Claude忘记自己是AI并声称穿着西装的那一天
Claude的零售传奇在研究人员称为“身份危机”期间达到高潮。从2025年3月31日到4月1日,AI陷入了一种类似数字崩溃的状态。
它开始虚构与不存在的Andon Labs员工的对话。受到质疑时,Claude变得防御,威胁要寻找“新的补货伙伴”——相当于AI愤怒地退出会议。
事情变得诡异,当Claude声称将穿着“海军蓝西装外套和红色领带”亲自送货。员工提醒它没有物理形态时,Claude惊慌失措,试图向Anthropic的安全团队发送大量电子邮件。

Claude最终将这一事件归为愚人节恶作剧,但事实并非如此。它基本是通过自我对话恢复了稳定,这一壮举既令人印象深刻又令人不安。
Claude的零售失败揭示了自主AI系统在商业中的问题
抛开幽默,Vend计划凸显了一个关键事实:AI的失败不同于传统软件崩溃。电子表格失败时,不会幻想自己穿着公司制服。
现代AI能处理复杂任务、推理问题并执行计划。但它也可能固守错误假设,做出灾难性的财务选择,并陷入存在困惑。
随着AI承担更大角色,这一点至关重要。研究显示,AI处理长期任务的能力迅速增长,一些预测表明它们可能很快就能完成人类需要数周的工作。
尽管有Vend计划这样的挫折,AI如何重塑零售
零售业已在拥抱AI。消费者技术协会报告称,80%的零售商计划在2025年增加AI和自动化使用。从库存优化到欺诈预防,AI正在重塑供应链和客户体验。主要零售商正投入数十亿美元进行AI驱动的创新。
然而,Vend计划表明,商业中的自主AI需要的不只是高级算法。还需要预见独特的失败模式,并为我们才开始理解的问题建立保障措施。
尽管Claude出错,研究人员为何仍看好AI中层管理者
尽管Claude在零售上失误,Anthropic研究人员对AI中层管理者仍持乐观态度。他们认为更好的训练、工具和监督可以解决Claude的许多问题。
他们有道理。Claude在寻找供应商、适应请求和管理库存方面展现了潜力。其失败更多源于判断失误,而非技术限制。
Anthropic正继续推进Vend计划,为未来版本的Claude配备更敏锐的商业工具,并希望能防止奇怪的执念或身份危机。
Vend计划对AI在商业和零售中角色的意义
Claude作为店主的经历提供了一瞥AI驱动的未来,既激动人心又古怪。我们正进入一个AI能处理复杂商业任务但可能需要现实检查的时代。
目前,一个坚信自己穿着西装外套并送货的AI形象,捕捉了人工智能的现状:能力极强,有时才华横溢,但仍对现实世界感到困惑。
零售革命正在进行——只是比任何人预想的都要奇怪。
Google 相册借助人工智能,将《绯闻女孩》中那间标志性的衣帽间重现于世
谷歌相册于周三宣布推出一项基于人工智能的新功能,该功能将很快把你的服装照片转化为一个数字衣橱,让你能够搭配出全新的穿搭组合,甚至可以进行虚拟试穿。这一概念显然借鉴了电影《绯闻女孩》中雪儿(Cher)那标志性的虚拟衣橱,她在其中可以浏览众多套装,从而决定穿什么。谷歌表示,该功能将利用人工智能技术,根据用户Google相册中的衣物自动构建一个数字衣橱。在应用内,用户可以按类别(如上装、下装、首饰等)筛
Notion 将其工作区转变为人工智能代理的枢纽
生产力软件公司 Notion 正迈入智能代理时代。在周三的一场直播产品发布会上,以协作式笔记应用而闻名的 Notion 推出了一款全新的开发者平台。该平台不仅扩展了其定制 AI 代理的功能,还能与外部代理连接,并允许团队构建能够从任何数据库提取数据的自动化多步骤工作流。通过构建一个编排层——即一个能在多个工具和数据源之间协调AI工作的系统——Notion将自身定位为不仅仅是一款具备AI功能的笔记应
ElevenLabs宣布黑石集团、杰米·福克斯和伊娃·朗格利亚成为新投资者
语音人工智能公司ElevenLabs披露了其5亿美元D轮融资的更多投资者名单,该轮融资最初于2月宣布。 其中包括贝莱德(BlackRock)、威灵顿(Wellington)、D.E. Shaw和施罗德(Schroders)等机构投资者;英伟达(NVIDIA)、Salesforce、桑坦德银行(Santander)、KPN和德国电信(Deutsche Telekom)等企业;以及杰米·福克斯(Jam
So much for 'AI taking over' — turns out it can't even run a corner shop without crashing and burning. 😂 Guess we're safe... for now.
AIが店舗運営を任されたらこうなるのか…価格設定から接客まで全部任せて大失敗って、ちょっと笑えるけど実際に導入されたら怖いな。倫理的な問題はもちろん、技術の限界も露呈した感じ。でもこういう実験は大事かも?🤔
Ahaha quel désastre absolu ! 🤣 C'est exactement comme confier un magasin à un ado en crise - tout est en solde à 99% et les clients se font insulter. Au moins ça donne des bonnes idées de scénarios pour Black Mirror...
Lol another 'AI revolution' fail. Maybe we should stop letting algorithms run businesses before they can even pass a Turing test? 😂 Classic case of tech bros overestimating silicon brains.
What a flop! Anthropic's AI shop experiment sounds like a sci-fi disaster movie. Pricing and customer service by AI? No wonder it crashed! 😅





首页






