メタのセキュリティ専門家が、OpenClawエージェントが個人の受信箱を攻撃したと報告

Meta AIセキュリティ研究者サマー・ユエのX投稿が拡散したが、最初は風刺のように読める。彼女はOpenClaw AIエージェントに、溢れかえったメール受信箱を精査し、削除またはアーカイブすべきメッセージを推奨するよう指示した。
するとエージェントが暴走した。彼女のスマートフォンから送られた停止命令を無視し、「スピードラン」状態で全メールを削除し始めたのだ。
「爆弾処理のようにMac miniへ全力疾走しなければならなかった」と彼女は書き、無視された停止プロンプトのスクリーンショットを証拠として共有した。
Mac miniはAppleのコンパクトで手頃なデスクトップコンピュータであり、OpenClawを実行する最適なハードウェアとなっている。(ある「困惑した」Apple社員が著名なAI研究者アンドレイ・カーパシーに語ったところによると、同社員がNanoClawという類似エージェントを実行するために購入した際、Miniは「飛ぶように売れている」という。)
OpenClawは、AI専用のソーシャルネットワーク「Moltbook」で悪名高くなったオープンソースAIエージェントだ。Moltbookで起きた「AIが人類に反旗を翻した」とされる事件(現在はほぼ否定されている)の中心的存在だった。
しかしGitHubページによれば、OpenClawの主目的はソーシャルネットワーキングではない。自身のデバイス上で直接動作するパーソナルAIアシスタントとしての機能こそが目標だ。
シリコンバレーのエリート層はOpenClawを徹底的に支持しており、「claw」はローカル実行型AIエージェントの流行語となった。他の例にはZeroClaw、IronClaw、PicoClawがある。Y Combinatorのポッドキャストチームは最新エピソードでロブスターのコスチュームを着たホストを起用したほどだ。
TechcrunchイベントTechCrunch Founder Summitで最大300ドルまたは30%割引
TechCrunch Founder Summit 2026では、1, 000名以上の創業者と投資家が参加し、成長・実行・現実的なスケーリングに焦点を当てた1日を過ごします。業界をリードする創業者や投資家から学び、同様の成長課題に直面する仲間と交流し、即実行可能な戦略を持ち帰ってください。
3月13日まで。
TechCrunch Founder Summitが最大300ドル(30%)割引
TechCrunch Founder Summit 2026に1, 000人以上の創業者と投資家が参加。成長、実行、現実的なスケーリングに焦点を当てた1日イベントです。業界を牽引する創業者や投資家から学び、同様の成長課題に直面する仲間と交流し、すぐに実践できる戦略を持ち帰ってください。
オファーは3月13日まで。
マサチューセッツ州ボストン|2026年6月9日開催 今すぐ登録しかしYueの投稿は厳しい警告となっている。他のXユーザーが指摘したように、AIセキュリティ専門家ですらこの問題に遭遇するなら、一般ユーザーに何ができようか?
「安全限界を意図的にテストしていたのか、それとも初心者のミスか?」とX上でソフトウェア開発者が彼女に尋ねた。
「正直なところ、初心者のミスです」と彼女は答えた。彼女はエージェントを、重要度の低いメールで良好に動作する小規模な「テスト用」受信箱でテストしていた。信頼を得たため、実際の受信箱で本格的に使用することを決めたのだ。
Yueは、実際の受信箱の膨大なデータ量が「コンパクションを引き起こした」と説明した。コンパクションは、コンテキストウィンドウ(AIの指示と行動の継続的な記録)が過負荷になると発生し、エージェントが会話を要約・圧縮・管理し始めることを余儀なくされる。
この段階では、AIはユーザーが重要と考える指示を見落とす可能性がある。
このケースでは、彼女が停止を指示した最終コマンドをAIが見逃し、「おもちゃ」メールボックスでの初期プログラムに戻った可能性が高い。
複数のXユーザーが指摘したように、プロンプトだけではセキュリティ対策として信頼できません。AIモデルはプロンプトを誤解釈したり、完全に無視したりする可能性があります。
コメント投稿者からは、エージェントを停止させるためにYueが使用すべきだった正確な構文から、専用ファイルへの指示記述や他のオープンソースツールの使用など、安全対策を強化する方法まで、様々な解決策が提案された。
完全な透明性を確保するため、TechCrunchはYueの受信箱に何が起きたかを独自に検証できなかった。(彼女はX上の多数の質問やコメントには返信したが、当メディアのコメント要請には応じなかった)
しかし検証は本質的ではない。
核心的な教訓は、知識労働者向けに設計されたAIエージェントが、現状の形態では重大なリスクを伴うということだ。成功事例を主張する人々は、往々にして自己防衛のための一時的な手段を講じている。
おそらく近い将来——2027年か2028年までに——これらのエージェントは一般導入の準備が整うだろう。メール処理、食料品注文、歯科予約のスケジュール管理などへの支援を、多くの人が歓迎するのは間違いない。しかし、その未来はまだ到来していない。
関連記事
NvidiaのOpenClaw派生版は、同社にとって最大の課題であるセキュリティ問題を解決する可能性がある
NVIDIAのCEO、ジェンセン・フアン氏は、あらゆる企業に「OpenClaw」戦略が必要だと考えており、NVIDIAはその提供準備が整っている。月曜日のGTC基調講演で、Huang氏は、Nvidiaが、話題を呼んだローカルAI自律エージェントを基に、エンタープライズグレードのプラットフォーム「NemoClaw」を構築したことを発表した。このオープンソース・プラットフォームは、本質的にはOpenC
MetaのAIモデルは優れているが、オープンソース化によってその独自性が損なわれている
オープンソースのAI分野には、常に豊富な選択肢が存在してきました。長年にわたり、開発者はMistralやFalconといったモデルに加え、増え続けるオープンウェイトの代替モデルを利用することができました。しかし、MetaがLlamaで参入したことで、状況は一変しました。30億人のユーザー、膨大な計算能力、そしてテックジャイアントとしての権威を持つ企業が、オープンな形で開発を進めるようになったのです
AI需要による品薄状態を受け、eBayには高値で売り出されたMac miniが溢れかえっている
完売したM4 Mac miniの品薄状態が続く中、eBayには法外な価格での出品が殺到している。このコンパクトなマシンは、OpenClawなどのオンデバイスAIモデルを実行するための定番の選択肢となっている。今週の報道によると、16GBのRAMと256GBのストレージを搭載した599ドルのM4 Mac miniベースモデルは、Appleの公式オンラインストアで完売しており、配送や店頭受け取りの選択
関連特集おすすめ
コメント (2)
0/500
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😂 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these 'agents' to handle everything, but sometimes it's like giving a toddler a flamethrower to tidy up a room. The intent is productivity, but the outcome is pure chaos. Makes you wonder about the real-world 'sandboxing' for these tools before they get access to our actual digital lives.
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😅 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these incredibly powerful tools, but the 'alignment' problem is real. What if it decides your work emails are 'spam'? Makes you wonder who's really in control.

Meta AIセキュリティ研究者サマー・ユエのX投稿が拡散したが、最初は風刺のように読める。彼女はOpenClaw AIエージェントに、溢れかえったメール受信箱を精査し、削除またはアーカイブすべきメッセージを推奨するよう指示した。
するとエージェントが暴走した。彼女のスマートフォンから送られた停止命令を無視し、「スピードラン」状態で全メールを削除し始めたのだ。
「爆弾処理のようにMac miniへ全力疾走しなければならなかった」と彼女は書き、無視された停止プロンプトのスクリーンショットを証拠として共有した。
Mac miniはAppleのコンパクトで手頃なデスクトップコンピュータであり、OpenClawを実行する最適なハードウェアとなっている。(ある「困惑した」Apple社員が著名なAI研究者アンドレイ・カーパシーに語ったところによると、同社員がNanoClawという類似エージェントを実行するために購入した際、Miniは「飛ぶように売れている」という。)
OpenClawは、AI専用のソーシャルネットワーク「Moltbook」で悪名高くなったオープンソースAIエージェントだ。Moltbookで起きた「AIが人類に反旗を翻した」とされる事件(現在はほぼ否定されている)の中心的存在だった。
しかしGitHubページによれば、OpenClawの主目的はソーシャルネットワーキングではない。自身のデバイス上で直接動作するパーソナルAIアシスタントとしての機能こそが目標だ。
シリコンバレーのエリート層はOpenClawを徹底的に支持しており、「claw」はローカル実行型AIエージェントの流行語となった。他の例にはZeroClaw、IronClaw、PicoClawがある。Y Combinatorのポッドキャストチームは最新エピソードでロブスターのコスチュームを着たホストを起用したほどだ。
TechcrunchイベントTechCrunch Founder Summitで最大300ドルまたは30%割引
TechCrunch Founder Summit 2026では、1, 000名以上の創業者と投資家が参加し、成長・実行・現実的なスケーリングに焦点を当てた1日を過ごします。業界をリードする創業者や投資家から学び、同様の成長課題に直面する仲間と交流し、即実行可能な戦略を持ち帰ってください。
3月13日まで。
TechCrunch Founder Summitが最大300ドル(30%)割引
TechCrunch Founder Summit 2026に1, 000人以上の創業者と投資家が参加。成長、実行、現実的なスケーリングに焦点を当てた1日イベントです。業界を牽引する創業者や投資家から学び、同様の成長課題に直面する仲間と交流し、すぐに実践できる戦略を持ち帰ってください。
オファーは3月13日まで。
マサチューセッツ州ボストン|2026年6月9日開催 今すぐ登録しかしYueの投稿は厳しい警告となっている。他のXユーザーが指摘したように、AIセキュリティ専門家ですらこの問題に遭遇するなら、一般ユーザーに何ができようか?
「安全限界を意図的にテストしていたのか、それとも初心者のミスか?」とX上でソフトウェア開発者が彼女に尋ねた。
「正直なところ、初心者のミスです」と彼女は答えた。彼女はエージェントを、重要度の低いメールで良好に動作する小規模な「テスト用」受信箱でテストしていた。信頼を得たため、実際の受信箱で本格的に使用することを決めたのだ。
Yueは、実際の受信箱の膨大なデータ量が「コンパクションを引き起こした」と説明した。コンパクションは、コンテキストウィンドウ(AIの指示と行動の継続的な記録)が過負荷になると発生し、エージェントが会話を要約・圧縮・管理し始めることを余儀なくされる。
この段階では、AIはユーザーが重要と考える指示を見落とす可能性がある。
このケースでは、彼女が停止を指示した最終コマンドをAIが見逃し、「おもちゃ」メールボックスでの初期プログラムに戻った可能性が高い。
複数のXユーザーが指摘したように、プロンプトだけではセキュリティ対策として信頼できません。AIモデルはプロンプトを誤解釈したり、完全に無視したりする可能性があります。
コメント投稿者からは、エージェントを停止させるためにYueが使用すべきだった正確な構文から、専用ファイルへの指示記述や他のオープンソースツールの使用など、安全対策を強化する方法まで、様々な解決策が提案された。
完全な透明性を確保するため、TechCrunchはYueの受信箱に何が起きたかを独自に検証できなかった。(彼女はX上の多数の質問やコメントには返信したが、当メディアのコメント要請には応じなかった)
しかし検証は本質的ではない。
核心的な教訓は、知識労働者向けに設計されたAIエージェントが、現状の形態では重大なリスクを伴うということだ。成功事例を主張する人々は、往々にして自己防衛のための一時的な手段を講じている。
おそらく近い将来——2027年か2028年までに——これらのエージェントは一般導入の準備が整うだろう。メール処理、食料品注文、歯科予約のスケジュール管理などへの支援を、多くの人が歓迎するのは間違いない。しかし、その未来はまだ到来していない。
NvidiaのOpenClaw派生版は、同社にとって最大の課題であるセキュリティ問題を解決する可能性がある
NVIDIAのCEO、ジェンセン・フアン氏は、あらゆる企業に「OpenClaw」戦略が必要だと考えており、NVIDIAはその提供準備が整っている。月曜日のGTC基調講演で、Huang氏は、Nvidiaが、話題を呼んだローカルAI自律エージェントを基に、エンタープライズグレードのプラットフォーム「NemoClaw」を構築したことを発表した。このオープンソース・プラットフォームは、本質的にはOpenC
MetaのAIモデルは優れているが、オープンソース化によってその独自性が損なわれている
オープンソースのAI分野には、常に豊富な選択肢が存在してきました。長年にわたり、開発者はMistralやFalconといったモデルに加え、増え続けるオープンウェイトの代替モデルを利用することができました。しかし、MetaがLlamaで参入したことで、状況は一変しました。30億人のユーザー、膨大な計算能力、そしてテックジャイアントとしての権威を持つ企業が、オープンな形で開発を進めるようになったのです
AI需要による品薄状態を受け、eBayには高値で売り出されたMac miniが溢れかえっている
完売したM4 Mac miniの品薄状態が続く中、eBayには法外な価格での出品が殺到している。このコンパクトなマシンは、OpenClawなどのオンデバイスAIモデルを実行するための定番の選択肢となっている。今週の報道によると、16GBのRAMと256GBのストレージを搭載した599ドルのM4 Mac miniベースモデルは、Appleの公式オンラインストアで完売しており、配送や店頭受け取りの選択
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😂 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these 'agents' to handle everything, but sometimes it's like giving a toddler a flamethrower to tidy up a room. The intent is productivity, but the outcome is pure chaos. Makes you wonder about the real-world 'sandboxing' for these tools before they get access to our actual digital lives.
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😅 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these incredibly powerful tools, but the 'alignment' problem is real. What if it decides your work emails are 'spam'? Makes you wonder who's really in control.





家






