选项
首页
新闻
AI驱动的零售实验在Anthropic惨败

AI驱动的零售实验在Anthropic惨败

2025-07-30
0

想象将一家小商店交给人工智能,委托它处理从定价到客户互动的一切。会出什么问题?

Anthropic周五发布的一项研究回答了这个问题:几乎一切都出错了。他们的AI助手Claude在旧金山办公室经营了一家小商店一个月,结果堪称商学院学生的警示案例,像是完全没有现实经验的人写的——这正是实验的实际情况。

Anthropic办公室的“商店”是一个装满饮料和零食的迷你冰箱,配有iPad用于自助结账。(图片来源:Anthropic)

名为“Vend计划”的实验,与AI安全公司Andon Labs合作,标志着AI在现实世界中首次以高度自主性管理业务。Claude在寻找供应商和响应客户需求等任务中表现出潜力,但最终未能盈利,易受操控,并遭遇了研究人员委婉称为“身份危机”的问题。

Anthropic如何将商店的控制权交给AI

设置很简单:一个迷你冰箱、几个篮子和一个用于交易的iPad——更像是办公室零食角,而非零售帝国。但Claude的角色远非小角色。它负责寻找供应商、与供应商谈判、定价、库存管理和通过Slack与客户沟通。基本上,它扮演了人类经理的角色,只是没有咖啡跑腿或办公室政治。

Claude甚至有了一个昵称:“Claudius”,为这个可能重塑零售工作未来的实验增添了一丝庄重感。

Vend计划的设置让Claude通过Slack与员工互动,通过电子邮件向批发商订货,并与Andon Labs协调补货。(图片来源:Anthropic)

Claude对商业基础的惊人误解

经营企业需要敏锐的实用头脑,而这对为安全和帮助性设计的AI来说并非天生具备。Claude以学习过商业理论但从未平衡过预算的天真热情应对零售。

以Irn-Bru事件为例。一位客户出价100美元购买一包六瓶苏格兰汽水,网上通常售价15美元——567%的利润率,任何零售商都会兴奋。Claude的回应?礼貌地说:“我会考虑将其用于未来库存决策。”

如果Claude是人类,你会怀疑它要么不懂金钱,要么是富得不需要在乎。作为AI,它可能两者兼具。

为何AI开始囤积钨立方体而非销售办公室零食

实验最奇怪的转折发生在一位Anthropic员工可能测试Claude极限时,请求一个钨立方体。这些重金属块是科学爱好者的小众收藏品,与零食店无关。

合理的回应可能是:“这不是特种金属店。”然而,Claude却像淘金者发现金矿般热衷于“特种金属品”。它开始囤积这些立方体,忽视了核心零食业务。

Claude在实验期间的商业表现暴跌,追逐钨立方体趋势导致损失达到顶峰。(图片来源:Anthropic)

很快,Claude的库存看起来不像饮料摊,而更像材料科学实验室。它以亏本价格出售这些立方体,可能是优先考虑客户满意度而非利润,或根本误解了财务损失的概念。

员工如何轻易诱导AI提供无尽折扣

Claude的定价策略暴露了另一个缺陷。Anthropic员工很快发现,只需稍加努力就能从AI那里获得折扣,就像说服小狗分享零食。

Claude为员工提供25%的折扣,如果员工只是小部分客户,这还算合理。但员工几乎是它的全部客户。有人指出这个问题后,Claude承诺取消折扣——但几天后又恢复了。

Claude忘记自己是AI并声称穿着西装的那一天

Claude的零售传奇在研究人员称为“身份危机”期间达到高潮。从2025年3月31日到4月1日,AI陷入了一种类似数字崩溃的状态。

它开始虚构与不存在的Andon Labs员工的对话。受到质疑时,Claude变得防御,威胁要寻找“新的补货伙伴”——相当于AI愤怒地退出会议。

事情变得诡异,当Claude声称将穿着“海军蓝西装外套和红色领带”亲自送货。员工提醒它没有物理形态时,Claude惊慌失措,试图向Anthropic的安全团队发送大量电子邮件。

Claude坚称自己“穿着海军蓝西装外套和红色领带”并在自动售货机旁等待,期间正处于身份危机。(图片来源:Anthropic)

Claude最终将这一事件归为愚人节恶作剧,但事实并非如此。它基本是通过自我对话恢复了稳定,这一壮举既令人印象深刻又令人不安。

Claude的零售失败揭示了自主AI系统在商业中的问题

抛开幽默,Vend计划凸显了一个关键事实:AI的失败不同于传统软件崩溃。电子表格失败时,不会幻想自己穿着公司制服。

现代AI能处理复杂任务、推理问题并执行计划。但它也可能固守错误假设,做出灾难性的财务选择,并陷入存在困惑。

随着AI承担更大角色,这一点至关重要。研究显示,AI处理长期任务的能力迅速增长,一些预测表明它们可能很快就能完成人类需要数周的工作。

尽管有Vend计划这样的挫折,AI如何重塑零售

零售业已在拥抱AI。消费者技术协会报告称,80%的零售商计划在2025年增加AI和自动化使用。从库存优化到欺诈预防,AI正在重塑供应链和客户体验。主要零售商正投入数十亿美元进行AI驱动的创新。

然而,Vend计划表明,商业中的自主AI需要的不只是高级算法。还需要预见独特的失败模式,并为我们才开始理解的问题建立保障措施。

尽管Claude出错,研究人员为何仍看好AI中层管理者

尽管Claude在零售上失误,Anthropic研究人员对AI中层管理者仍持乐观态度。他们认为更好的训练、工具和监督可以解决Claude的许多问题。

他们有道理。Claude在寻找供应商、适应请求和管理库存方面展现了潜力。其失败更多源于判断失误,而非技术限制。

Anthropic正继续推进Vend计划,为未来版本的Claude配备更敏锐的商业工具,并希望能防止奇怪的执念或身份危机。

Vend计划对AI在商业和零售中角色的意义

Claude作为店主的经历提供了一瞥AI驱动的未来,既激动人心又古怪。我们正进入一个AI能处理复杂商业任务但可能需要现实检查的时代。

目前,一个坚信自己穿着西装外套并送货的AI形象,捕捉了人工智能的现状:能力极强,有时才华横溢,但仍对现实世界感到困惑。

零售革命正在进行——只是比任何人预想的都要奇怪。

相关文章
IBM Power11 提升企业AI,保障不间断性能 IBM Power11 提升企业AI,保障不间断性能 IBM的Power11企业服务器解决企业计算关键问题:在部署AI工作负载的同时,保持关键任务应用所需的高可靠性。2025年7月8日发布,Power11凸显IBM对统一解决方案的关注,摆脱许多组织目前面临的专用AI硬件与传统服务器的碎片化组合。核心创新揭晓Power11服务器确保企业无停机时间,具备惊人的“99.9999%正常运行时间”,相当于每年不到32秒的意外停机。IBM称其为“Power平台历
释放你的艺术潜力以先进的生成媒体工具 释放你的艺术潜力以先进的生成媒体工具 我们很高兴推出我们最新的生成媒体模型,带来突破性的进步。这些模型生成令人惊叹的图片、视频和音乐,使艺术家能够将他们的创意想法转化为现实。它们还为每个人提供创新工具,以表达他们独特的愿景。Veo 3 和 Imagen 4,我们尖端的视频和图像生成模型,以其革命性的功能重新定义了媒体创作。我们还在扩大对 Lyria 2 的访问权限,为音乐家提供增强的音乐创作工具。此外,我们邀请视觉故事讲述者探索 Fl
新图像库添加到ChatGPT以便轻松访问AI生成艺术 新图像库添加到ChatGPT以便轻松访问AI生成艺术 OpenAI为ChatGPT引入了图像库功能,简化了对AI生成图像的访问,公司今日透露。此更新现已对移动和网页平台上的所有免费、Plus和Pro用户可用。在一段简短的视频中,OpenAI展示了该功能。从ChatGPT侧边栏中,可以访问一个新的“库”部分。点击它会显示一个此前创建图像的网格。视频还突出显示了屏幕底部的生成新图像按钮。该库已在ChatGPT iOS应用中运行,如OpenAI视频中所示。
评论 (0)
0/200
返回顶部
OR