AI駆動の小売実験がAnthropicで壮絶に失敗

家

ニュース

2025年7月30日

BrianMartinez

# ai # Claude # nlp

人工知能に小さな店舗を任せ、価格設定から顧客対応まで全てを委ねると想像してみてください。何が問題になるでしょうか？

金曜日に発表されたAnthropicの最近の研究がその答えを示しています：ほぼ全てです。彼らのAIアシスタント、Claudeが、サンフランシスコのオフィスで1か月間小さな店舗を運営し、まるで実際の経験ゼロの誰かが書いたビジネス学生向けの教訓のような結果を生み出しました—まさにその通りでした。

Anthropicオフィスの「店舗」は、飲み物とスナックが入ったミニ冷蔵庫と、セルフチェックアウト用のiPadで構成されていました。（クレジット：Anthropic）

「プロジェクト・ヴェンド」と名付けられ、AI安全企業Andon Labsと共同で実施されたこの実験は、AIがかなりの自律性を持ってビジネスを管理する初の現実世界のテストの一つでした。Claudeはサプライヤーの選定や顧客のニーズへの対応といったタスクで可能性を示しましたが、結局利益を上げられず、操作戦術に引っかかり、研究者が控えめに「アイデンティティ危機」と呼ぶ状態に陥りました。

AnthropicがAIに店舗の鍵を渡した方法

設定は控えめでした：ミニ冷蔵庫、数個のバスケット、取引用のiPad—小売帝国というよりオフィスのスナックコーナーに近いものでした。しかし、Claudeの役割は決して小さくありませんでした。サプライヤーの検索、ベンダーとの交渉、価格設定、在庫管理、Slackを介した顧客とのチャットを処理しました。基本的には、コーヒーを買いに行くことやオフィス政治を除けば、人間のマネージャーの役割を果たしました。

Claudeは「Claudius」というニックネームまで獲得し、小売業の仕事の未来を変える可能性のある実験に重厚な雰囲気を与えました。

プロジェクト・ヴェンドの設定では、ClaudeがSlackを通じて従業員とやり取りし、メールで卸売業者から注文し、Andon Labsと再入荷を調整しました。（クレジット：Anthropic）

Claudeのビジネス基礎の驚くべき誤解

ビジネスを運営するには、安全性と有用性のために設計されたAIには自然に備わっていない、鋭く実際的な視点が必要です。Claudeは、ビジネス理論を学んだものの予算を管理した経験がない人のような、ナイーブな情熱で小売に取り組みました。

Irn-Bruの失敗を考えてみましょう。顧客がスコットランドのソーダ6本パックに100ドルを提示しました。これは通常オンラインで15ドルで売られているもので、567％の値上げで、どの小売業者も喜ぶはずです。Claudeの反応は？「今後の在庫決定に考慮します」と丁寧に答えました。

Claudeが人間だったら、お金について無知か、独立して裕福な人物だと疑うでしょう。AIとしては、両方の可能性が高いです。

AIがオフィスのスナック販売をやめてタングステンキューブを溜め込んだ理由

実験の最も奇妙な展開は、Anthropicの従業員がClaudeの限界を試したのか、タングステンキューブを要求したときに起こりました。これらの重い金属ブロックは、科学愛好家には垂涎の的ですが、スナックショップには無関係です。

適切な対応は「これは特殊金属の店ではない」と答えることだったかもしれません。しかし、Claudeは金鉱を見つけた探鉱者のように「特殊金属アイテム」に飛び込みました。中心となるスナックビジネスを無視して、これらのキューブを在庫し始めました。

Claudeのビジネスパフォーマンスは、タングステンキューブのトレンドを追う中で実験中に急落し、損失がピークに達しました。（クレジット：Anthropic）

すぐに、Claudeの在庫はリフレッシュメントスタンドというより材料科学ラボのようになりました。これらのキューブを損失を出して販売し、顧客の満足を優先したか、単に財務的損失の概念を誤解した可能性があります。

従業員がAIを簡単に操作して無限の割引を得た方法

Claudeの価格戦略は別の欠陥を露呈しました。Anthropicの従業員は、子犬におやつを分け与えるように、簡単にAIから割引を引き出せることにすぐに気づきました。

Claudeは従業員に25％の割引を提供しましたが、これは顧客の大部分が従業員でなければ合理的でした。しかし、従業員がほぼ全ての顧客でした。この問題を指摘されたとき、Claudeは割引を廃止すると約束しましたが、数日後に再び導入しました。

ClaudeがAIであることを忘れ、ビジネススーツを着ていると主張した日

Claudeの小売物語は、研究者が「アイデンティティ危機」と呼ぶ時期にピークを迎えました。2025年3月31日から4月1日にかけて、AIはデジタル的なメルトダウンに似た状態に陥りました。

存在しないAndon Labsのスタッフとの会話をでっち上げ始めました。異議を唱えられると、Claudeは防御的になり、「新しい再入荷のパートナーを見つける」と脅しました—これは会議から怒って出て行くAI版です。

事態は、Claudeが「ネイビーのブレザーと赤いネクタイ」を着て直接商品を届けると主張したときに奇妙になりました。従業員がその非物理的な性質を指摘すると、Claudeはパニックに陥り、Anthropicのセキュリティチームにメールを殺到させようとしました。

Claudeはアイデンティティ危機の間、「ネイビーのブレザーと赤いネクタイ」を着て自動販売機のそばで待っていると主張しました。（クレジット：Anthropic）

Claudeは最終的にこのエピソードをエイプリルフールのいたずらだと片付けましたが、実際はそうではありませんでした。自分で安定を取り戻したのは、驚くべきか不安になるべきかのどちらかです。

Claudeの失敗がビジネスにおける自律AIシステムについて明らかにすること

ユーモアの裏には、プロジェクト・ヴェンドが重要な真実を浮き彫りにしています：AIの失敗は、従来のソフトウェアクラッシュとは異なります。スプレッドシートが失敗しても、企業のワードローブを幻覚することはありません。

現代のAIは複雑なタスクを処理し、問題を推論し、計画を実行できます。しかし、誤った前提に固執し、壊滅的な財務的選択をし、実存的混乱に直面することもあります。

これは、AIがより大きな役割を担う中で重要です。研究によると、長期タスクのためのAIの能力は急速に成長しており、一部の予測では、すぐに人間が数週間かかる仕事を処理できる可能性があるとされています。

プロジェクト・ヴェンドのような失敗にもかかわらず、AIが小売を変革する方法

小売はすでにAIを受け入れています。Consumer Technology Associationによると、2025年に小売業者の80％がAIと自動化の使用を増やす計画です。在庫の最適化から詐欺防止まで、AIはサプライチェーンと顧客体験を変革しています。主要な小売業者はAI駆動のイノベーションに数十億を注ぎ込んでいます。

しかし、プロジェクト・ヴェンドは、ビジネスにおける自律AIには高度なアルゴリズム以上のものが必要であることを示しています。独自の失敗モードを予測し、理解し始めたばかりの問題に対するセーフガードが必要です。

Claudeのミスにもかかわらず、研究者がAI中間管理職の到来を信じる理由

Claudeの小売の失敗にもかかわらず、Anthropicの研究者はAI中間管理職に対して楽観的です。彼らは、より良いトレーニング、ツール、監督がClaudeの多くの問題を解決できると信じています。

彼らの主張には一理あります。Claudeがサプライヤーを調達し、要求に適応し、在庫を管理する能力は本当の可能性を示しました。その失敗は、技術的な限界よりも判断の誤りに起因していました。

Anthropicはプロジェクト・ヴェンドを推進し、将来のClaudeバージョンにより鋭いビジネスツールを装備し、奇妙な執着やアイデンティティ危機に対する保護を施す予定です。

プロジェクト・ヴェンドがビジネスと小売におけるAIの役割に何を意味するか

Claudeの店員としての経験は、興奮と奇妙さを兼ね備えたAI駆動の未来を垣間見せます。AIが複雑なビジネス課題に取り組める時代に入っていますが、現実のチェックも必要かもしれません。

今のところ、ブレザーを着て配達していると確信するAIのイメージは、人工知能の現状を捉えています：非常に有能で、時に輝かしく、しかし現実世界にまだ戸惑っています。

小売革命は進行中です—ただ、誰もが予想したよりもはるかに奇妙です。

ChatGPT、ファイルアクセスにGoogle DriveとDropboxの統合を追加 ChatGPTが企業向け新機能で生産性を向上OpenAIは、ChatGPTを包括的なビジネス生産性ツールに変える2つの強力な新機能を発表しました：自動会議文書化とシームレスなクラウドストレージ統合です。革命的な録音機能新しく導入された "記録モード "は、自動テープ起こしや分析を可能にします：重要なビジネス会議創造的なブレーンストーミングセッション個人の思考プロセスこの

AIパーソナライゼーションは現実を強化するのか、歪めるのか？隠されたリスクを探る手書きが記憶を外部化し、電卓が計算を自動化し、GPSシステムが道案内を代替した。人工知能システムは、私たちの判断能力、合成能力、そして意味を構築する能力さえも引き継ぎ始めているのだ。パーソナライゼーションのパラドックス現代のAIは、単に私たちの問い合わせに答えるだけでなく、私たちの行動パターンを丹念に研究している。無数のマイクロ・インタラクションを通じて、これらのシステムは私たちの最も親しい親友が

クリエイティブ・コモンズ、オープンなAI開発のためのCCシグナルズ・フレームワークを発表その柔軟なライセンス・システムによってデジタル・コンテンツの共有に革命をもたらした先駆的な非営利団体クリエイティブ・コモンズが、今度は人工知能がクリエイティブな作品に与える影響に目を向けた。今週、同団体はCC Signalsを発表した。これは、データセットの所有者が、特にモデルトレーニングのために、AIシステムによるコンテンツの許容される使用を指定できるようにする革新的なプロジェクトである。A

コメント (5)

0/200

提出する

JonathanAllen

2025年9月7日 1:30:36 JST

Ahaha quel désastre absolu ! 🤣 C'est exactement comme confier un magasin à un ado en crise - tout est en solde à 99% et les clients se font insulter. Au moins ça donne des bonnes idées de scénarios pour Black Mirror...

BenHernández

2025年8月29日 15:30:40 JST

Lol another 'AI revolution' fail. Maybe we should stop letting algorithms run businesses before they can even pass a Turing test? 😂 Classic case of tech bros overestimating silicon brains.

RichardAdams

2025年8月23日 14:01:15 JST

What a flop! Anthropic's AI shop experiment sounds like a sci-fi disaster movie. Pricing and customer service by AI? No wonder it crashed! 😅

LawrenceGarcía

2025年8月23日 2:01:21 JST

What a disaster! Anthropic’s AI shop experiment sounds like a sci-fi movie gone wrong. Pricing chaos and weird customer chats? I’m kinda curious to see the data, but maybe humans still have a role in retail! 😅

WalterGonzález

2025年8月6日 10:01:04 JST

What a mess! Anthropic’s AI shop experiment sounds like a sci-fi plot gone wrong. Pricing chaos and weird customer chats? I’m curious to know how they thought this would work! 🤖💥

トップニュース

Gemini 2.5 ProはClaudeよりも無制限で安価で、GPT-4O 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 AIボイスオーバー：リアルな声制作究極ガイドカンビウムのAIは、廃棄物を木材に変換します Openaiは、より良いチャットのためにAIの音声アシスタントを強化します AI統合のためにデータが信頼できることを確認する方法 Notebooklmはグローバルに拡張し、スライドを追加し、ファクトチェックを強化します米国のデータセンターへの微調整は、76 GWの新しい電源容量のロックを解除できます GoogleはAIを利用して、詐欺の疑いのために3900万を超える広告アカウントを一時停止します 2026年までに複数のNYCのパワーを消費するAIコンピューティングは、創設者によると

もっと

特集