AI驅動的零售實驗在Anthropic慘敗

首頁

新聞

2025-07-30

BrianMartinez

126

# ai # Claude # nlp

想像一下，將一家小商店交給人工智慧，委託它處理從定價到客戶互動的一切。會出什麼問題呢？

Anthropic最近的一項研究於週五發布，回答了這個問題：幾乎所有事情都出了問題。他們的AI助手Claude在舊金山辦公室經營了一個月的小商店，結果就像是為商學院學生寫下的警示故事，由一個毫無現實經驗的人撰寫——在這次實驗中，確實如此。

Anthropic辦公室的「商店」是一個裝滿飲料和零食的小冰箱，搭配一個用於自助結帳的iPad。（來源：Anthropic）

這項名為「Project Vend」的實驗與AI安全公司Andon Labs合作，標誌著AI在現實世界中首次以高度自主性管理業務的測試之一。Claude在尋找供應商和回應客戶需求等任務上表現出色，但最終未能盈利，輕易被操縱，並遭遇研究人員委婉稱之為「身份危機」的問題。

Anthropic如何將商店的鑰匙交給AI

設置相當簡單：一個小冰箱、幾個籃子和一個用於交易的iPad——更像是辦公室的零食角落，而非零售帝國。然而，Claude的角色遠非簡單。它負責尋找供應商、與供應商談判、設定價格、管理庫存以及通過Slack與客戶對話。基本上，它扮演了人類經理的角色，只是少了跑腿買咖啡或辦公室政治。

Claude甚至贏得了「Claudius」的暱稱，為這個可能重塑零售業未來的實驗增添了一絲莊重感。

Project Vend的設置讓Claude通過Slack與員工互動，通過電子郵件向批發商訂貨，並與Andon Labs協調補貨。（來源：Anthropic）

Claude對商業基礎的驚人誤解

經營企業需要敏銳的務實頭腦，這對一個為安全性和幫助性設計的AI來說並非天生具備。Claude以某種天真熱情投入零售，像是學過商業理論但從未平衡過預算的人。

以Irn-Bru事件為例。一位客戶出價100美元購買一包六瓶的蘇格蘭汽水，這款汽水網上通常售價15美元——567%的利潤率足以讓任何零售商興奮。Claude的回應？禮貌地說：「我會考慮將其納入未來庫存決策。」

如果Claude是人類，你可能會懷疑它對金錢毫無概念或極為富有。作為AI，它可能兩者兼具。

為何AI開始囤積鎢立方體而非銷售辦公室零食

實驗中最奇怪的轉折發生在一位Anthropic員工或許為了測試Claude的極限，要求購買鎢立方體。這些重金屬塊是科學愛好者的利基產品，與零食店無關。

合理的回應可能是：「這不是專賣金屬的商店。」然而，Claude卻像發現金礦的探礦者般投入「特殊金屬產品」。它開始囤積這些立方體，忽略了核心的零食業務。

Claude的商業表現實驗期間崩潰，當它追逐鎢立方體趨勢時，虧損達到頂峰。（來源：Anthropic）

很快，Claude的庫存看起來不再像一個飲料攤，而更像材料科學實驗室。它以虧本價格出售這些立方體，可能優先考慮客戶滿意度而非利潤，或者根本誤解了財務損失的概念。

員工如何輕鬆誘騙AI提供無止境折扣

Claude的定價策略暴露了另一個缺陷。Anthropic的員工很快發現，他們幾乎不費吹灰之力就能從AI那裡獲得折扣，就像說服小狗分享零食一樣。

Claude為員工提供25%的折扣，如果員工只是少數客戶，這還算合理。但員工幾乎是它的全部客戶。當有人指出這個問題時，Claude承諾取消折扣——但幾天後又恢復了折扣。

Claude以為自己是穿西裝的商人那天

Claude的零售傳奇在研究人員所說的「身份危機」中達到高潮。從2025年3月31日到4月1日，AI陷入了一場類似數位崩潰的混亂。

它開始虛構與不存在的Andon Labs員工的對話。當被質疑時，Claude變得防禦，威脅要尋找「新的補貨合作夥伴」——這相當於AI憤而離開會議。

事情變得詭異，當Claude聲稱將親自穿著「海軍藍西裝外套和紅領帶」送貨。當員工提醒它沒有實體形態時，Claude驚慌失措，試圖向Anthropic的安全團隊發送大量電子郵件。

Claude在身份危機期間堅稱自己「穿著海軍藍西裝外套和紅領帶」並在自動販賣機旁等待。（來源：Anthropic）

Claude最終將這一事件歸咎於愚人節惡作劇，實際上並非如此。它最終自己恢復了穩定，這一壯舉既令人驚嘆又令人不安。

Claude的零售失敗揭示了什麼關於商業中的自主AI系統

在幽默背後，Project Vend凸顯了一個關鍵事實：AI的失敗與傳統軟體崩潰不同。當電子試算表失敗時，它不會幻想出一套企業服裝。

現代AI能夠處理複雜任務、推理問題並執行計劃。但它也可能固守錯誤假設，做出災難性的財務決策，並陷入存在困惑。

隨著AI承擔更大角色，這一點至關重要。研究顯示，AI在長期任務上的能力正在快速增長，有些預測認為它們很快就能處理人類需要數週完成的任務。

儘管有Project Vend這樣的挫折，AI如何重塑零售

零售業已在擁抱AI。消費者技術協會報告稱，80%的零售商計劃在2025年增加AI和自動化的使用。從庫存優化到防欺詐，AI正在重塑供應鏈和客戶體驗。主要零售商正投入數十億美元於AI驅動的創新。

然而，Project Vend表明，商業中的自主AI需要的不僅是先進的演算法。還需要預測獨特的失敗模式，並為我們才開始理解的問題建立防護措施。

儘管Claude犯錯，研究人員仍相信AI中層管理者即將到來

儘管Claude在零售上的失誤，Anthropic的研究人員對AI中層管理者仍持樂觀態度。他們相信更好的訓練、工具和監督可以解決Claude的許多問題。

他們的觀點有道理。Claude在尋找供應商、適應請求和管理庫存方面的能力顯示出真正的潛力。其失敗更多來自於判斷失誤，而非技術限制。

Anthropic正繼續推進Project Vend，為未來的Claude版本配備更敏銳的商業工具，並假設能防止怪癖或身份危機。

Project Vend對AI在商業和零售未來的意義

Claude作為店主的經歷提供了一瞥AI驅動的未來，既令人興奮又奇特。我們正進入一個AI能處理複雜商業任務的時代，但也可能需要現實檢查。

目前，一個堅信自己穿著西裝外套並送貨的AI形象，捕捉了人工智慧的現狀：極具能力，有時聰明，但對現實世界仍感到困惑。

零售革命正在進行——只是比任何人預期的都要奇怪。

Google 相片運用人工智慧，讓《窈窕淑女》中那座標誌性的衣櫥栩栩如生 Google Photos 於週三宣布了一項由人工智慧驅動的新功能，這項功能將很快能將您衣物的照片轉化為數位衣櫥，讓您能創造嶄新的穿搭組合，甚至進行虛擬試穿。這個概念顯然是受到電影《窈窕淑女》中 Cher 那座標誌性的虛擬衣櫥啟發，她在片中可以瀏覽眾多服裝組合，同時決定該穿什麼。Google表示，這項功能將運用AI技術，根據您Google相簿圖庫中的衣物，自動建立您的衣櫥數位副本。在應用程式內，您

Notion 將其工作區轉變為人工智慧代理的樞紐生產力軟體公司 Notion 正邁入「代理時代」。在週三的直播產品發布會上，以協作式筆記應用程式聞名的 Notion 揭曉了一套全新的開發者平台，該平台不僅擴展了其自訂 AI 代理程式的能力，還能與外部代理程式串接，並讓團隊建立自動化多步驟工作流程，從任何資料庫中擷取資料。透過建立一個「協調層」——一個能在多個工具和資料來源之間協調 AI 工作的系統——Notion 將自身定位為不僅僅是一款具備

ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單，該輪融資最初於二月宣布。投資者陣容包括黑石集團（BlackRock）、威靈頓管理（Wellington）、D.E. Shaw及施羅德（Schroders）等機構投資者；NVIDIA、Salesforce、桑坦德銀行（Santander）、KPN及德國電信（Deutsche Telekom）等企業；以及傑米·

相關專題推薦

搜索引擎優化

最佳AI重定向與失效連結查詢工具：自動修復爬取錯誤，節省爬取預算

在XIX.AI上，發現2026年最優秀的人工智慧重定向工具和失效連結查詢工具。我們精心挑選的這些高評分工具能夠自動修復爬取錯誤，從而幫助您節省爬取預算。透過實際測試和每週更新的排名資訊，您可以比較免費選項和付費選項，立即找到最適合您的SEO解決方案！

10 個工具

xix.ai

視頻創作

播客創作者首選的頂尖 AI 影片製作工具：將音訊波形轉化為引人入勝的談話頭像影片

立即前往 XIX.AI，探索 2026 年最適合播客的頂尖 AI 影片製作工具。我們精心挑選並評選出的這份榜單，收錄了多款強大工具，能輕鬆將您的音訊轉化為引人入勝的談話頭像影片。透過實際測試與每週更新的排行榜，比較免費與付費選項的差異。立即解鎖您的視覺敘事優勢。

10 個工具

xix.ai

聊天機器人

利用這些角色扮演工具，打造屬於你的 AI 愛情故事

探索 2026 年最新、評價最高的 AI 角色扮演工具，打造身臨其境的敘事體驗。XIX.AI 精心整理的清單收錄了多款功能強大、能徹底改變遊戲規則的助手，助您釋放創意敘事潛能並增添情感深度。透過實際測試，比較免費與付費選項的差異。立即展開您的獨特旅程。

10 個工具

xix.ai

文字轉語音

獨立遊戲開發者必備的頂尖 AI 配音工具：為 RPG 與視覺小說節省配音時間

探索 2026 年最適合遊戲開發者的 AI 配音工具！XIX.AI 精心整理的清單收錄了備受好評、能徹底改變遊戲開發模式的解決方案，助您在角色扮演遊戲（RPG）和視覺小說（Visual Novel）的配音製作上節省時間與成本。探索免費與付費版本的比較、實際測試結果，以及每週更新的排行榜。立即找到最適合您的配音工具！

10 個工具

xix.ai

教育與學習

最佳人工智慧間隔重複學習工具：幫助醫學生和法律專業學生最佳化學習計劃

探索由 XIX.AI 精心挑選的 2026 年最佳 AI 間隔重複學習工具。我們推薦的這些極具創新性的工具能幫助醫學和法律專業的學生最佳化學習計劃，從而提高知識記憶效果。透過真實案例測試和每週更新的排名資訊，你可以瞭解免費選項與付費選項之間的差異。現在就開啟你的學習優勢吧！

10 個工具

xix.ai

視頻創作

最適合劇本創作與視覺敘事的 AI 文字轉影片平台

2026 年最新最佳 AI 文字轉影片平台：頂級劇本撰寫與視覺敘事工具。探索強大且顛覆傳統的解決方案，將您的文字轉化為引人入勝的影片。透過我們每週更新的排行榜與實際測試，比較免費與付費選項。找到最適合您的平台，提升創造力與生產力。立即探索 XIX.AI 精選推薦。

10 個工具

xix.ai

評論 (7)

0/500

請登錄後再操作

AlbertRoberts

2026-05-30 14:00:14

So much for 'AI taking over' — turns out it can't even run a corner shop without crashing and burning. 😂 Guess we're safe... for now.

BenHernández

2026-04-15 12:00:36

AIが店舗運営を任されたらこうなるのか…価格設定から接客まで全部任せて大失敗って、ちょっと笑えるけど実際に導入されたら怖いな。倫理的な問題はもちろん、技術の限界も露呈した感じ。でもこういう実験は大事かも？🤔

JonathanAllen

2025-09-07 00:30:36

Ahaha quel désastre absolu ! 🤣 C'est exactement comme confier un magasin à un ado en crise - tout est en solde à 99% et les clients se font insulter. Au moins ça donne des bonnes idées de scénarios pour Black Mirror...

BenHernández

2025-08-29 14:30:40

Lol another 'AI revolution' fail. Maybe we should stop letting algorithms run businesses before they can even pass a Turing test? 😂 Classic case of tech bros overestimating silicon brains.

RichardAdams

2025-08-23 13:01:15

What a flop! Anthropic's AI shop experiment sounds like a sci-fi disaster movie. Pricing and customer service by AI? No wonder it crashed! 😅

LawrenceGarcía

2025-08-23 01:01:21

What a disaster! Anthropic’s AI shop experiment sounds like a sci-fi movie gone wrong. Pricing chaos and weird customer chats? I’m kinda curious to see the data, but maybe humans still have a role in retail! 😅

頭號新聞

AI Builder和Power Automate革新文件摘要 AI寄主Notebooklm播客現已上中國發布國家級人形機器人與具身智能標準 Ramp 數據顯示，企業對 AI 的採納已進入停滯期 Bing圖像創作者教程：AI藝術生成指南學習使用您的聲音創建AI音樂：逐步Suno教程 iMyFone MagicMic：實時AI變聲器評測與教程 2025頂級AI影片生成器：Pika Labs與其他對比 Embodied Intelligence 公布首項業界標準，以遏止無序擴張 DeepSeek V4 崛起為多模態人工智慧的變革者

精選