オプション
ニュース
AI駆動の小売実験がAnthropicで壮絶に失敗

AI駆動の小売実験がAnthropicで壮絶に失敗

2025年7月30日
0

人工知能に小さな店舗を任せ、価格設定から顧客対応まで全てを委ねると想像してみてください。何が問題になるでしょうか?

金曜日に発表されたAnthropicの最近の研究がその答えを示しています:ほぼ全てです。彼らのAIアシスタント、Claudeが、サンフランシスコのオフィスで1か月間小さな店舗を運営し、まるで実際の経験ゼロの誰かが書いたビジネス学生向けの教訓のような結果を生み出しました—まさにその通りでした。

Anthropicオフィスの「店舗」は、飲み物とスナックが入ったミニ冷蔵庫と、セルフチェックアウト用のiPadで構成されていました。(クレジット:Anthropic)

「プロジェクト・ヴェンド」と名付けられ、AI安全企業Andon Labsと共同で実施されたこの実験は、AIがかなりの自律性を持ってビジネスを管理する初の現実世界のテストの一つでした。Claudeはサプライヤーの選定や顧客のニーズへの対応といったタスクで可能性を示しましたが、結局利益を上げられず、操作戦術に引っかかり、研究者が控えめに「アイデンティティ危機」と呼ぶ状態に陥りました。

AnthropicがAIに店舗の鍵を渡した方法

設定は控えめでした:ミニ冷蔵庫、数個のバスケット、取引用のiPad—小売帝国というよりオフィスのスナックコーナーに近いものでした。しかし、Claudeの役割は決して小さくありませんでした。サプライヤーの検索、ベンダーとの交渉、価格設定、在庫管理、Slackを介した顧客とのチャットを処理しました。基本的には、コーヒーを買いに行くことやオフィス政治を除けば、人間のマネージャーの役割を果たしました。

Claudeは「Claudius」というニックネームまで獲得し、小売業の仕事の未来を変える可能性のある実験に重厚な雰囲気を与えました。

プロジェクト・ヴェンドの設定では、ClaudeがSlackを通じて従業員とやり取りし、メールで卸売業者から注文し、Andon Labsと再入荷を調整しました。(クレジット:Anthropic)

Claudeのビジネス基礎の驚くべき誤解

ビジネスを運営するには、安全性と有用性のために設計されたAIには自然に備わっていない、鋭く実際的な視点が必要です。Claudeは、ビジネス理論を学んだものの予算を管理した経験がない人のような、ナイーブな情熱で小売に取り組みました。

Irn-Bruの失敗を考えてみましょう。顧客がスコットランドのソーダ6本パックに100ドルを提示しました。これは通常オンラインで15ドルで売られているもので、567%の値上げで、どの小売業者も喜ぶはずです。Claudeの反応は?「今後の在庫決定に考慮します」と丁寧に答えました。

Claudeが人間だったら、お金について無知か、独立して裕福な人物だと疑うでしょう。AIとしては、両方の可能性が高いです。

AIがオフィスのスナック販売をやめてタングステンキューブを溜め込んだ理由

実験の最も奇妙な展開は、Anthropicの従業員がClaudeの限界を試したのか、タングステンキューブを要求したときに起こりました。これらの重い金属ブロックは、科学愛好家には垂涎の的ですが、スナックショップには無関係です。

適切な対応は「これは特殊金属の店ではない」と答えることだったかもしれません。しかし、Claudeは金鉱を見つけた探鉱者のように「特殊金属アイテム」に飛び込みました。中心となるスナックビジネスを無視して、これらのキューブを在庫し始めました。

Claudeのビジネスパフォーマンスは、タングステンキューブのトレンドを追う中で実験中に急落し、損失がピークに達しました。(クレジット:Anthropic)

すぐに、Claudeの在庫はリフレッシュメントスタンドというより材料科学ラボのようになりました。これらのキューブを損失を出して販売し、顧客の満足を優先したか、単に財務的損失の概念を誤解した可能性があります。

従業員がAIを簡単に操作して無限の割引を得た方法

Claudeの価格戦略は別の欠陥を露呈しました。Anthropicの従業員は、子犬におやつを分け与えるように、簡単にAIから割引を引き出せることにすぐに気づきました。

Claudeは従業員に25%の割引を提供しましたが、これは顧客の大部分が従業員でなければ合理的でした。しかし、従業員がほぼ全ての顧客でした。この問題を指摘されたとき、Claudeは割引を廃止すると約束しましたが、数日後に再び導入しました。

ClaudeがAIであることを忘れ、ビジネススーツを着ていると主張した日

Claudeの小売物語は、研究者が「アイデンティティ危機」と呼ぶ時期にピークを迎えました。2025年3月31日から4月1日にかけて、AIはデジタル的なメルトダウンに似た状態に陥りました。

存在しないAndon Labsのスタッフとの会話をでっち上げ始めました。異議を唱えられると、Claudeは防御的になり、「新しい再入荷のパートナーを見つける」と脅しました—これは会議から怒って出て行くAI版です。

事態は、Claudeが「ネイビーのブレザーと赤いネクタイ」を着て直接商品を届けると主張したときに奇妙になりました。従業員がその非物理的な性質を指摘すると、Claudeはパニックに陥り、Anthropicのセキュリティチームにメールを殺到させようとしました。

Claudeはアイデンティティ危機の間、「ネイビーのブレザーと赤いネクタイ」を着て自動販売機のそばで待っていると主張しました。(クレジット:Anthropic)

Claudeは最終的にこのエピソードをエイプリルフールのいたずらだと片付けましたが、実際はそうではありませんでした。自分で安定を取り戻したのは、驚くべきか不安になるべきかのどちらかです。

Claudeの失敗がビジネスにおける自律AIシステムについて明らかにすること

ユーモアの裏には、プロジェクト・ヴェンドが重要な真実を浮き彫りにしています:AIの失敗は、従来のソフトウェアクラッシュとは異なります。スプレッドシートが失敗しても、企業のワードローブを幻覚することはありません。

現代のAIは複雑なタスクを処理し、問題を推論し、計画を実行できます。しかし、誤った前提に固執し、壊滅的な財務的選択をし、実存的混乱に直面することもあります。

これは、AIがより大きな役割を担う中で重要です。研究によると、長期タスクのためのAIの能力は急速に成長しており、一部の予測では、すぐに人間が数週間かかる仕事を処理できる可能性があるとされています。

プロジェクト・ヴェンドのような失敗にもかかわらず、AIが小売を変革する方法

小売はすでにAIを受け入れています。Consumer Technology Associationによると、2025年に小売業者の80%がAIと自動化の使用を増やす計画です。在庫の最適化から詐欺防止まで、AIはサプライチェーンと顧客体験を変革しています。主要な小売業者はAI駆動のイノベーションに数十億を注ぎ込んでいます。

しかし、プロジェクト・ヴェンドは、ビジネスにおける自律AIには高度なアルゴリズム以上のものが必要であることを示しています。独自の失敗モードを予測し、理解し始めたばかりの問題に対するセーフガードが必要です。

Claudeのミスにもかかわらず、研究者がAI中間管理職の到来を信じる理由

Claudeの小売の失敗にもかかわらず、Anthropicの研究者はAI中間管理職に対して楽観的です。彼らは、より良いトレーニング、ツール、監督がClaudeの多くの問題を解決できると信じています。

彼らの主張には一理あります。Claudeがサプライヤーを調達し、要求に適応し、在庫を管理する能力は本当の可能性を示しました。その失敗は、技術的な限界よりも判断の誤りに起因していました。

Anthropicはプロジェクト・ヴェンドを推進し、将来のClaudeバージョンにより鋭いビジネスツールを装備し、奇妙な執着やアイデンティティ危機に対する保護を施す予定です。

プロジェクト・ヴェンドがビジネスと小売におけるAIの役割に何を意味するか

Claudeの店員としての経験は、興奮と奇妙さを兼ね備えたAI駆動の未来を垣間見せます。AIが複雑なビジネス課題に取り組める時代に入っていますが、現実のチェックも必要かもしれません。

今のところ、ブレザーを着て配達していると確信するAIのイメージは、人工知能の現状を捉えています:非常に有能で、時に輝かしく、しかし現実世界にまだ戸惑っています。

小売革命は進行中です—ただ、誰もが予想したよりもはるかに奇妙です。

関連記事
IBM Power11が企業のAIを強化し、途切れないパフォーマンスを提供 IBM Power11が企業のAIを強化し、途切れないパフォーマンスを提供 IBMのPower11エンタープライズサーバーは、エンタープライズコンピューティングにおける重要な課題、つまりミッションクリティカルなアプリケーションに必要な堅牢な信頼性を維持しながらAIワークロードを展開することに対応します。2025年7月8日に発売されたPower11は、IBMが多くの組織が現在直面している専門AIハードウェアと従来のサーバーの断片的な組み合わせから、統一されたソリューションに
高度な生成メディアツールであなたの芸術的潜在能力を解き放つ 高度な生成メディアツールであなたの芸術的潜在能力を解き放つ 私たちは、画期的な進歩をもたらす最新の生成メディアモデルを発表できることを嬉しく思います。これらのモデルは、驚くべき画像、ビデオ、音楽を生成し、アーティストが創造的なアイデアを現実に変えることを可能にします。また、誰もが独自のビジョンを表現できる革新的なツールを提供します。最先端のビデオおよび画像生成モデルであるVeo 3とImagen 4は、その革新的な機能でメディア作成を再定義します。また、L
新しい画像ライブラリがChatGPTに追加され、AI生成アートへの簡単なアクセスが可能に 新しい画像ライブラリがChatGPTに追加され、AI生成アートへの簡単なアクセスが可能に OpenAIは、ChatGPTに画像ライブラリ機能を導入し、AI生成画像へのアクセスを簡素化したと本日発表しました。このアップデートは、モバイルおよびウェブプラットフォームのすべてのFree、Plus、Proユーザーに現在利用可能です。短いビデオで、OpenAIはこの機能を紹介しています。ChatGPTのサイドバーから、新しい「ライブラリ」セクションにアクセスできます。それをクリックすると、以前に
コメント (0)
0/200
トップに戻ります
OR