Anthropic社の実験用AI「Claude」が、Eコマースのテストにおいて交渉と取引を完了した
人工知能(AI)が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。

実験の中核となったのは、Slack上に構築された社内マーケットプレイスであり、そこでClaudeは買い手と売り手の双方の交渉役を務めました。まず69名の従業員にインタビューを行い、売買の意向や個別の指示を収集した上で、自律的に交渉を進めました。 実験期間中、Claudeは総額4,000ドルを超える186件の取引を成功裏に完了し、実世界の市場環境においてAIが機能する能力を実証しました。
徹底性を確保するため、Anthropicはさらに4つの並行市場を設け、異なるAIモデルが交渉においてどのようなパフォーマンスを示すかを比較しました。 その結果、モデルの能力の違いが取引結果に大きな影響を与えることが明らかになった。例えば、OpusモデルとHaikuモデルが対決した場合、Opusは交渉においてHaikuを明らかに上回ったが、調査対象の従業員はこの違いに気づかなかった。この知見は、AIシステム間の将来の商業的相互作用について新たな視点を提供するものである。
「Project Deal」の発表は、特に従来のeコマースプラットフォームに対する潜在的な脅威という点で、市場の大きな注目を集めた。このニュースを受けて、eBayの株価は市場終了時点で約4.5%下落した。観測筋は、この下落をAI技術の応用と、それがeコマースのビジネスモデルに与える破壊的な影響に起因すると広く見ている。
Anthropicは市場が著しく分断されている時期にこの実験を公開することを選択したが、それにもかかわらず市場の反応は顕著であり、eコマースにおけるAIの破壊的な可能性を浮き彫りにした。
関連記事
ChatGPTの「アダルトモード」のリリースが再び延期;ウルトラマン:知性を最優先に
OpenAI、物議を醸す機能を再び延期、パーソナライゼーションと能動的な対話に注力「不適切なコンテンツ」が生産的なAIツールの一部であるべきかどうかは、長らくテック業界で議論を呼んできた。 ChatGPTが成人ユーザーをより深く理解できるようになると約束していたOpenAIだが、この変更を待ち望んでいた人々を再び失望させてしまった。IT Homeによると、同社は最近、当初2026年第1四半期のリリ
Baidu Healthは、学術情報の検索や事務支援を目的としたAI医師アシスタント「DoctorClaw」を、短期的に社内テストしている。
報道によると、百度健康(Baidu Health)は、医師向けに設計された専門的なAIスマートアシスタントの社内テストを開始した。社内で「DoctorClaw」(ロブスター・ドクター版)と呼ばれるこの製品は、医療分野における百度の大規模言語モデルの展開において、重要な一歩となるものだ。関係者によると、このプロジェクトは依然として非公開の開発段階にあり、現在は社内テスト段階に入っている。具体的な製品
「Cursor Composer 2」対「Claude Opus 4.6」:ベンチマークテストがAIコーディングを巡る新たな議論を巻き起こす
3月19日、Cursorは自社開発のコーディングモデル「Composer 2」を正式にリリースした。 この発表は開発者コミュニティで即座に議論を巻き起こした。Cursorによると、Composer 2はTerminal-Bench 2.0で61.7%のスコアを記録し、同一のテスト条件下でClaude Opus 4.6の58.0%を大幅に上回ったという。Anthropicのフラッグシップモデルが、自
関連特集おすすめ
コメント (0)
0/500
人工知能(AI)が急速に進化する中、Anthropicは先週金曜日、「Project Deal」と呼ばれる社内実験をひっそりと開始し、EコマースにおけるAIの可能性を披露した。この実験では、同社のAIモデル「Claude」が、実際の金銭取引を伴うクローズドな市場環境において、購入、販売、価格交渉を自律的に行うよう設計された。

実験の中核となったのは、Slack上に構築された社内マーケットプレイスであり、そこでClaudeは買い手と売り手の双方の交渉役を務めました。まず69名の従業員にインタビューを行い、売買の意向や個別の指示を収集した上で、自律的に交渉を進めました。 実験期間中、Claudeは総額4,000ドルを超える186件の取引を成功裏に完了し、実世界の市場環境においてAIが機能する能力を実証しました。
徹底性を確保するため、Anthropicはさらに4つの並行市場を設け、異なるAIモデルが交渉においてどのようなパフォーマンスを示すかを比較しました。 その結果、モデルの能力の違いが取引結果に大きな影響を与えることが明らかになった。例えば、OpusモデルとHaikuモデルが対決した場合、Opusは交渉においてHaikuを明らかに上回ったが、調査対象の従業員はこの違いに気づかなかった。この知見は、AIシステム間の将来の商業的相互作用について新たな視点を提供するものである。
「Project Deal」の発表は、特に従来のeコマースプラットフォームに対する潜在的な脅威という点で、市場の大きな注目を集めた。このニュースを受けて、eBayの株価は市場終了時点で約4.5%下落した。観測筋は、この下落をAI技術の応用と、それがeコマースのビジネスモデルに与える破壊的な影響に起因すると広く見ている。
Anthropicは市場が著しく分断されている時期にこの実験を公開することを選択したが、それにもかかわらず市場の反応は顕著であり、eコマースにおけるAIの破壊的な可能性を浮き彫りにした。
ChatGPTの「アダルトモード」のリリースが再び延期;ウルトラマン:知性を最優先に
OpenAI、物議を醸す機能を再び延期、パーソナライゼーションと能動的な対話に注力「不適切なコンテンツ」が生産的なAIツールの一部であるべきかどうかは、長らくテック業界で議論を呼んできた。 ChatGPTが成人ユーザーをより深く理解できるようになると約束していたOpenAIだが、この変更を待ち望んでいた人々を再び失望させてしまった。IT Homeによると、同社は最近、当初2026年第1四半期のリリ
Baidu Healthは、学術情報の検索や事務支援を目的としたAI医師アシスタント「DoctorClaw」を、短期的に社内テストしている。
報道によると、百度健康(Baidu Health)は、医師向けに設計された専門的なAIスマートアシスタントの社内テストを開始した。社内で「DoctorClaw」(ロブスター・ドクター版)と呼ばれるこの製品は、医療分野における百度の大規模言語モデルの展開において、重要な一歩となるものだ。関係者によると、このプロジェクトは依然として非公開の開発段階にあり、現在は社内テスト段階に入っている。具体的な製品
「Cursor Composer 2」対「Claude Opus 4.6」:ベンチマークテストがAIコーディングを巡る新たな議論を巻き起こす
3月19日、Cursorは自社開発のコーディングモデル「Composer 2」を正式にリリースした。 この発表は開発者コミュニティで即座に議論を巻き起こした。Cursorによると、Composer 2はTerminal-Bench 2.0で61.7%のスコアを記録し、同一のテスト条件下でClaude Opus 4.6の58.0%を大幅に上回ったという。Anthropicのフラッグシップモデルが、自





家






