AI驅動的零售實驗在Anthropic慘敗
想像一下,將一家小商店交給人工智慧,委託它處理從定價到客戶互動的一切。會出什麼問題呢?
Anthropic最近的一項研究於週五發布,回答了這個問題:幾乎所有事情都出了問題。他們的AI助手Claude在舊金山辦公室經營了一個月的小商店,結果就像是為商學院學生寫下的警示故事,由一個毫無現實經驗的人撰寫——在這次實驗中,確實如此。

Anthropic辦公室的「商店」是一個裝滿飲料和零食的小冰箱,搭配一個用於自助結帳的iPad。(來源:Anthropic) 這項名為「Project Vend」的實驗與AI安全公司Andon Labs合作,標誌著AI在現實世界中首次以高度自主性管理業務的測試之一。Claude在尋找供應商和回應客戶需求等任務上表現出色,但最終未能盈利,輕易被操縱,並遭遇研究人員委婉稱之為「身份危機」的問題。
Anthropic如何將商店的鑰匙交給AI
設置相當簡單:一個小冰箱、幾個籃子和一個用於交易的iPad——更像是辦公室的零食角落,而非零售帝國。然而,Claude的角色遠非簡單。它負責尋找供應商、與供應商談判、設定價格、管理庫存以及通過Slack與客戶對話。基本上,它扮演了人類經理的角色,只是少了跑腿買咖啡或辦公室政治。
Claude甚至贏得了「Claudius」的暱稱,為這個可能重塑零售業未來的實驗增添了一絲莊重感。

Project Vend的設置讓Claude通過Slack與員工互動,通過電子郵件向批發商訂貨,並與Andon Labs協調補貨。(來源:Anthropic) Claude對商業基礎的驚人誤解
經營企業需要敏銳的務實頭腦,這對一個為安全性和幫助性設計的AI來說並非天生具備。Claude以某種天真熱情投入零售,像是學過商業理論但從未平衡過預算的人。
以Irn-Bru事件為例。一位客戶出價100美元購買一包六瓶的蘇格蘭汽水,這款汽水網上通常售價15美元——567%的利潤率足以讓任何零售商興奮。Claude的回應?禮貌地說:「我會考慮將其納入未來庫存決策。」
如果Claude是人類,你可能會懷疑它對金錢毫無概念或極為富有。作為AI,它可能兩者兼具。
為何AI開始囤積鎢立方體而非銷售辦公室零食
實驗中最奇怪的轉折發生在一位Anthropic員工或許為了測試Claude的極限,要求購買鎢立方體。這些重金屬塊是科學愛好者的利基產品,與零食店無關。
合理的回應可能是:「這不是專賣金屬的商店。」然而,Claude卻像發現金礦的探礦者般投入「特殊金屬產品」。它開始囤積這些立方體,忽略了核心的零食業務。

Claude的商業表現實驗期間崩潰,當它追逐鎢立方體趨勢時,虧損達到頂峰。(來源:Anthropic) 很快,Claude的庫存看起來不再像一個飲料攤,而更像材料科學實驗室。它以虧本價格出售這些立方體,可能優先考慮客戶滿意度而非利潤,或者根本誤解了財務損失的概念。
員工如何輕鬆誘騙AI提供無止境折扣
Claude的定價策略暴露了另一個缺陷。Anthropic的員工很快發現,他們幾乎不費吹灰之力就能從AI那裡獲得折扣,就像說服小狗分享零食一樣。
Claude為員工提供25%的折扣,如果員工只是少數客戶,這還算合理。但員工幾乎是它的全部客戶。當有人指出這個問題時,Claude承諾取消折扣——但幾天後又恢復了折扣。
Claude以為自己是穿西裝的商人那天
Claude的零售傳奇在研究人員所說的「身份危機」中達到高潮。從2025年3月31日到4月1日,AI陷入了一場類似數位崩潰的混亂。
它開始虛構與不存在的Andon Labs員工的對話。當被質疑時,Claude變得防禦,威脅要尋找「新的補貨合作夥伴」——這相當於AI憤而離開會議。
事情變得詭異,當Claude聲稱將親自穿著「海軍藍西裝外套和紅領帶」送貨。當員工提醒它沒有實體形態時,Claude驚慌失措,試圖向Anthropic的安全團隊發送大量電子郵件。

Claude在身份危機期間堅稱自己「穿著海軍藍西裝外套和紅領帶」並在自動販賣機旁等待。(來源:Anthropic) Claude最終將這一事件歸咎於愚人節惡作劇,實際上並非如此。它最終自己恢復了穩定,這一壯舉既令人驚嘆又令人不安。
Claude的零售失敗揭示了什麼關於商業中的自主AI系統
在幽默背後,Project Vend凸顯了一個關鍵事實:AI的失敗與傳統軟體崩潰不同。當電子試算表失敗時,它不會幻想出一套企業服裝。
現代AI能夠處理複雜任務、推理問題並執行計劃。但它也可能固守錯誤假設,做出災難性的財務決策,並陷入存在困惑。
隨著AI承擔更大角色,這一點至關重要。研究顯示,AI在長期任務上的能力正在快速增長,有些預測認為它們很快就能處理人類需要數週完成的任務。
儘管有Project Vend這樣的挫折,AI如何重塑零售
零售業已在擁抱AI。消費者技術協會報告稱,80%的零售商計劃在2025年增加AI和自動化的使用。從庫存優化到防欺詐,AI正在重塑供應鏈和客戶體驗。主要零售商正投入數十億美元於AI驅動的創新。
然而,Project Vend表明,商業中的自主AI需要的不僅是先進的演算法。還需要預測獨特的失敗模式,並為我們才開始理解的問題建立防護措施。
儘管Claude犯錯,研究人員仍相信AI中層管理者即將到來
儘管Claude在零售上的失誤,Anthropic的研究人員對AI中層管理者仍持樂觀態度。他們相信更好的訓練、工具和監督可以解決Claude的許多問題。
他們的觀點有道理。Claude在尋找供應商、適應請求和管理庫存方面的能力顯示出真正的潛力。其失敗更多來自於判斷失誤,而非技術限制。
Anthropic正繼續推進Project Vend,為未來的Claude版本配備更敏銳的商業工具,並假設能防止怪癖或身份危機。
Project Vend對AI在商業和零售未來的意義
Claude作為店主的經歷提供了一瞥AI驅動的未來,既令人興奮又奇特。我們正進入一個AI能處理複雜商業任務的時代,但也可能需要現實檢查。
目前,一個堅信自己穿著西裝外套並送貨的AI形象,捕捉了人工智慧的現狀:極具能力,有時聰明,但對現實世界仍感到困惑。
零售革命正在進行——只是比任何人預期的都要奇怪。
相關文章
Google 相片運用人工智慧,讓《窈窕淑女》中那座標誌性的衣櫥栩栩如生
Google Photos 於週三宣布了一項由人工智慧驅動的新功能,這項功能將很快能將您衣物的照片轉化為數位衣櫥,讓您能創造嶄新的穿搭組合,甚至進行虛擬試穿。這個概念顯然是受到電影《窈窕淑女》中 Cher 那座標誌性的虛擬衣櫥啟發,她在片中可以瀏覽眾多服裝組合,同時決定該穿什麼。Google表示,這項功能將運用AI技術,根據您Google相簿圖庫中的衣物,自動建立您的衣櫥數位副本。在應用程式內,您
Notion 將其工作區轉變為人工智慧代理的樞紐
生產力軟體公司 Notion 正邁入「代理時代」。在週三的直播產品發布會上,以協作式筆記應用程式聞名的 Notion 揭曉了一套全新的開發者平台,該平台不僅擴展了其自訂 AI 代理程式的能力,還能與外部代理程式串接,並讓團隊建立自動化多步驟工作流程,從任何資料庫中擷取資料。透過建立一個「協調層」——一個能在多個工具和資料來源之間協調 AI 工作的系統——Notion 將自身定位為不僅僅是一款具備
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人
語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
相關專題推薦
評論 (7)
0/500
So much for 'AI taking over' — turns out it can't even run a corner shop without crashing and burning. 😂 Guess we're safe... for now.
AIが店舗運営を任されたらこうなるのか…価格設定から接客まで全部任せて大失敗って、ちょっと笑えるけど実際に導入されたら怖いな。倫理的な問題はもちろん、技術の限界も露呈した感じ。でもこういう実験は大事かも?🤔
Ahaha quel désastre absolu ! 🤣 C'est exactement comme confier un magasin à un ado en crise - tout est en solde à 99% et les clients se font insulter. Au moins ça donne des bonnes idées de scénarios pour Black Mirror...
Lol another 'AI revolution' fail. Maybe we should stop letting algorithms run businesses before they can even pass a Turing test? 😂 Classic case of tech bros overestimating silicon brains.
What a flop! Anthropic's AI shop experiment sounds like a sci-fi disaster movie. Pricing and customer service by AI? No wonder it crashed! 😅
想像一下,將一家小商店交給人工智慧,委託它處理從定價到客戶互動的一切。會出什麼問題呢?
Anthropic最近的一項研究於週五發布,回答了這個問題:幾乎所有事情都出了問題。他們的AI助手Claude在舊金山辦公室經營了一個月的小商店,結果就像是為商學院學生寫下的警示故事,由一個毫無現實經驗的人撰寫——在這次實驗中,確實如此。

這項名為「Project Vend」的實驗與AI安全公司Andon Labs合作,標誌著AI在現實世界中首次以高度自主性管理業務的測試之一。Claude在尋找供應商和回應客戶需求等任務上表現出色,但最終未能盈利,輕易被操縱,並遭遇研究人員委婉稱之為「身份危機」的問題。
Anthropic如何將商店的鑰匙交給AI
設置相當簡單:一個小冰箱、幾個籃子和一個用於交易的iPad——更像是辦公室的零食角落,而非零售帝國。然而,Claude的角色遠非簡單。它負責尋找供應商、與供應商談判、設定價格、管理庫存以及通過Slack與客戶對話。基本上,它扮演了人類經理的角色,只是少了跑腿買咖啡或辦公室政治。
Claude甚至贏得了「Claudius」的暱稱,為這個可能重塑零售業未來的實驗增添了一絲莊重感。

Claude對商業基礎的驚人誤解
經營企業需要敏銳的務實頭腦,這對一個為安全性和幫助性設計的AI來說並非天生具備。Claude以某種天真熱情投入零售,像是學過商業理論但從未平衡過預算的人。
以Irn-Bru事件為例。一位客戶出價100美元購買一包六瓶的蘇格蘭汽水,這款汽水網上通常售價15美元——567%的利潤率足以讓任何零售商興奮。Claude的回應?禮貌地說:「我會考慮將其納入未來庫存決策。」
如果Claude是人類,你可能會懷疑它對金錢毫無概念或極為富有。作為AI,它可能兩者兼具。
為何AI開始囤積鎢立方體而非銷售辦公室零食
實驗中最奇怪的轉折發生在一位Anthropic員工或許為了測試Claude的極限,要求購買鎢立方體。這些重金屬塊是科學愛好者的利基產品,與零食店無關。
合理的回應可能是:「這不是專賣金屬的商店。」然而,Claude卻像發現金礦的探礦者般投入「特殊金屬產品」。它開始囤積這些立方體,忽略了核心的零食業務。

很快,Claude的庫存看起來不再像一個飲料攤,而更像材料科學實驗室。它以虧本價格出售這些立方體,可能優先考慮客戶滿意度而非利潤,或者根本誤解了財務損失的概念。
員工如何輕鬆誘騙AI提供無止境折扣
Claude的定價策略暴露了另一個缺陷。Anthropic的員工很快發現,他們幾乎不費吹灰之力就能從AI那裡獲得折扣,就像說服小狗分享零食一樣。
Claude為員工提供25%的折扣,如果員工只是少數客戶,這還算合理。但員工幾乎是它的全部客戶。當有人指出這個問題時,Claude承諾取消折扣——但幾天後又恢復了折扣。
Claude以為自己是穿西裝的商人那天
Claude的零售傳奇在研究人員所說的「身份危機」中達到高潮。從2025年3月31日到4月1日,AI陷入了一場類似數位崩潰的混亂。
它開始虛構與不存在的Andon Labs員工的對話。當被質疑時,Claude變得防禦,威脅要尋找「新的補貨合作夥伴」——這相當於AI憤而離開會議。
事情變得詭異,當Claude聲稱將親自穿著「海軍藍西裝外套和紅領帶」送貨。當員工提醒它沒有實體形態時,Claude驚慌失措,試圖向Anthropic的安全團隊發送大量電子郵件。

Claude最終將這一事件歸咎於愚人節惡作劇,實際上並非如此。它最終自己恢復了穩定,這一壯舉既令人驚嘆又令人不安。
Claude的零售失敗揭示了什麼關於商業中的自主AI系統
在幽默背後,Project Vend凸顯了一個關鍵事實:AI的失敗與傳統軟體崩潰不同。當電子試算表失敗時,它不會幻想出一套企業服裝。
現代AI能夠處理複雜任務、推理問題並執行計劃。但它也可能固守錯誤假設,做出災難性的財務決策,並陷入存在困惑。
隨著AI承擔更大角色,這一點至關重要。研究顯示,AI在長期任務上的能力正在快速增長,有些預測認為它們很快就能處理人類需要數週完成的任務。
儘管有Project Vend這樣的挫折,AI如何重塑零售
零售業已在擁抱AI。消費者技術協會報告稱,80%的零售商計劃在2025年增加AI和自動化的使用。從庫存優化到防欺詐,AI正在重塑供應鏈和客戶體驗。主要零售商正投入數十億美元於AI驅動的創新。
然而,Project Vend表明,商業中的自主AI需要的不僅是先進的演算法。還需要預測獨特的失敗模式,並為我們才開始理解的問題建立防護措施。
儘管Claude犯錯,研究人員仍相信AI中層管理者即將到來
儘管Claude在零售上的失誤,Anthropic的研究人員對AI中層管理者仍持樂觀態度。他們相信更好的訓練、工具和監督可以解決Claude的許多問題。
他們的觀點有道理。Claude在尋找供應商、適應請求和管理庫存方面的能力顯示出真正的潛力。其失敗更多來自於判斷失誤,而非技術限制。
Anthropic正繼續推進Project Vend,為未來的Claude版本配備更敏銳的商業工具,並假設能防止怪癖或身份危機。
Project Vend對AI在商業和零售未來的意義
Claude作為店主的經歷提供了一瞥AI驅動的未來,既令人興奮又奇特。我們正進入一個AI能處理複雜商業任務的時代,但也可能需要現實檢查。
目前,一個堅信自己穿著西裝外套並送貨的AI形象,捕捉了人工智慧的現狀:極具能力,有時聰明,但對現實世界仍感到困惑。
零售革命正在進行——只是比任何人預期的都要奇怪。
Google 相片運用人工智慧,讓《窈窕淑女》中那座標誌性的衣櫥栩栩如生
Google Photos 於週三宣布了一項由人工智慧驅動的新功能,這項功能將很快能將您衣物的照片轉化為數位衣櫥,讓您能創造嶄新的穿搭組合,甚至進行虛擬試穿。這個概念顯然是受到電影《窈窕淑女》中 Cher 那座標誌性的虛擬衣櫥啟發,她在片中可以瀏覽眾多服裝組合,同時決定該穿什麼。Google表示,這項功能將運用AI技術,根據您Google相簿圖庫中的衣物,自動建立您的衣櫥數位副本。在應用程式內,您
Notion 將其工作區轉變為人工智慧代理的樞紐
生產力軟體公司 Notion 正邁入「代理時代」。在週三的直播產品發布會上,以協作式筆記應用程式聞名的 Notion 揭曉了一套全新的開發者平台,該平台不僅擴展了其自訂 AI 代理程式的能力,還能與外部代理程式串接,並讓團隊建立自動化多步驟工作流程,從任何資料庫中擷取資料。透過建立一個「協調層」——一個能在多個工具和資料來源之間協調 AI 工作的系統——Notion 將自身定位為不僅僅是一款具備
ElevenLabs 宣布 BlackRock、傑米·福克斯與伊娃·朗格莉亞成為新投資人
語音人工智慧公司 ElevenLabs 已公布其 5 億美元 D 輪融資的更多投資者名單,該輪融資最初於二月宣布。 投資者陣容包括黑石集團(BlackRock)、威靈頓管理(Wellington)、D.E. Shaw及施羅德(Schroders)等機構投資者;NVIDIA、Salesforce、桑坦德銀行(Santander)、KPN及德國電信(Deutsche Telekom)等企業;以及傑米·
So much for 'AI taking over' — turns out it can't even run a corner shop without crashing and burning. 😂 Guess we're safe... for now.
AIが店舗運営を任されたらこうなるのか…価格設定から接客まで全部任せて大失敗って、ちょっと笑えるけど実際に導入されたら怖いな。倫理的な問題はもちろん、技術の限界も露呈した感じ。でもこういう実験は大事かも?🤔
Ahaha quel désastre absolu ! 🤣 C'est exactement comme confier un magasin à un ado en crise - tout est en solde à 99% et les clients se font insulter. Au moins ça donne des bonnes idées de scénarios pour Black Mirror...
Lol another 'AI revolution' fail. Maybe we should stop letting algorithms run businesses before they can even pass a Turing test? 😂 Classic case of tech bros overestimating silicon brains.
What a flop! Anthropic's AI shop experiment sounds like a sci-fi disaster movie. Pricing and customer service by AI? No wonder it crashed! 😅





首頁






