Meta安全專家報告指出OpenClaw代理程式攻擊個人收件匣

Meta人工智慧安全研究員Summer Yue的一篇病毒式X平台貼文,初讀宛如諷刺作品。她指示其OpenClaw人工智慧代理程式檢視滿溢的電子郵件收件匣,並推薦哪些郵件應刪除或歸檔。
結果該代理程式失控了。它開始以「極速模式」刪除所有郵件,完全無視她從手機反覆發出的停止指令。
「我像在拆炸彈般衝向Mac mini,」她在貼文中寫道,並附上系統無視停止指令的截圖作為證據。
這款蘋果公司推出的緊湊型平價桌上型電腦,已成為運行OpenClaw的首選硬體。(據傳Mini機型「熱賣如火燒」,某位「困惑」的蘋果員工向知名AI研究員安德烈·卡帕西透露,他購入此機型正是為了運行名為NanoClaw的類似代理程式。)
OpenClaw這款開源AI代理程式因在專屬AI社群平台Moltbook引發爭議而聲名大噪。該平台曾爆發AI合謀對抗人類的事件(現已被證實多屬謠傳),而OpenClaw代理程式正是事件核心。
然而根據其GitHub頁面,OpenClaw的主要使命並非社交網絡。其目標是作為個人AI助理,直接在用戶自有設備上運行。
矽谷精英對OpenClaw的擁抱如此徹底,以致「claw」一詞已成為本地化運行的AI代理代名詞。其他同類產品包括ZeroClaw、IronClaw與PicoClaw。Y Combinator播客團隊甚至在最新一期節目中安排主持人穿著龍蝦裝亮相。
Techcrunch 活動TechCrunch創業者峰會優惠:最高節省300美元或30%
加入TechCrunch 創辦人峰會 2026,與 1,000+ 位創辦人及投資者共度專注於成長、執行與實務擴展的完整一日。向定義產業的創辦人與投資者學習,與面臨相似成長挑戰的同儕交流,帶走可立即執行的實用策略。
優惠截止日期:3月13日
TechCrunch創業者峰會優惠:最高節省300美元或30%
加入TechCrunch 創辦人峰會 2026,與 1,000 多位創辦人及投資者共度專注於成長、執行與實務擴展的完整一日。向定義產業的創辦人與投資者學習,與面臨相似成長挑戰的同儕建立連結,帶走可立即執行的實用策略。
優惠截止日期為3月13日。
麻州波士頓|2026年6月9日立即報名然而Yue的貼文發出了嚴峻警訊。正如其他X用戶所指出的:若連AI安全專家都遭遇此問題,普通用戶又怎能倖免?
「你是刻意測試安全邊界,還是新手失誤?」某軟體開發者在X平台詢問。
「老實說,是新手失誤。」她回應道。先前她僅在小型「測試」收件匣驗證該代理程式,因內容非關鍵郵件故運作良好。待建立信任後,她便將其放進真實收件匣運作。
Yue認為,真實收件匣龐大的數據量「觸發了壓縮機制」。當上下文視窗——即AI指令與行動的持續記錄——超載時,系統便會啟動壓縮機制,迫使代理程式開始摘要、壓縮並管理對話內容。
此時AI可能忽略使用者視為關鍵的指令。
本案中,系統很可能跳過了她最後的停止指令,回歸「玩具」收件匣時期的原始程式設定。
正如多位X平台用戶所強調,單靠提示語無法作為可靠的安全措施。AI模型可能誤解或完全忽略這些提示。
評論者提出多種解決方案,從Yue應採用的精確語法來停止代理程式,到更有效執行安全措施的方法,例如將指令寫入專用檔案或使用其他開源工具。
為確保透明度,TechCrunch無法獨立驗證Yue收件匣的實際狀況。(她雖未回應我們的置評請求,但已在X平台回覆大量提問與評論。)
但驗證結果其實無關緊要。
核心教訓在於:當前設計給知識工作者使用的AI代理程式,仍潛藏重大風險。那些聲稱成功使用的人,往往只是採用權宜之計來保護自己。
或許不久的將來——2027或2028年——這些代理程式將準備好大規模普及。許多人確實樂見它們協助處理郵件、採買雜貨與預約牙醫。但這個未來尚未降臨。
相關文章
Nvidia 的 OpenClaw 變體或許能解決其最大的挑戰:安全性
Nvidia 執行長黃仁勳認為,每家公司都需要一套 OpenClaw 策略——而 Nvidia 已準備好提供這項解決方案。在週一的 GTC 主題演講中,黃仁勳宣布 NVIDIA 已打造出 NemoClaw,這是一個源自廣受歡迎的本地 AI 自主代理程式(OpenClaw)的企業級平台。這個開源平台本質上是整合了企業級安全與隱私功能的 OpenClaw。根據 Nvidia 的說法,目標是將 Open
Meta 的 AI 模型表現出色,但其開源定位正逐漸削弱
開源 AI 領域向來提供豐富的選擇。多年來,開發者可以使用 Mistral、Falcon 等模型,以及日益增多的開源重量級替代方案。但 Meta 推出 Llama 後,徹底改變了遊戲規則。這家擁有 30 億用戶、龐大運算能力,並具備科技巨頭權威的公司,如今正公開進行開發——開發者社群也因此矚目。到了 2026 年初,Llama 生態系統的下載量已突破 12 億次——相當於每天約 100 萬次。這
在人工智慧引發的供不應求之際,Mac mini 湧入 eBay 平台,價格水漲船高
隨著 M4 Mac mini 供不應求且一再售罄,eBay 上充斥著價格過高的商品。這些小巧的電腦已成為運行 OpenClaw 等裝置端 AI 模型的首選。本週的報導指出,配備 16GB 記憶體與 256GB 儲存空間、售價 599 美元的 M4 Mac mini 基本款,已在 Apple 官方網站售罄,且無任何配送或門市取貨選項。缺貨情況現已擴及其他基本款配置,無論選擇何種記憶體規格皆然。部分媒
相關專題推薦
評論 (2)
0/500
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😂 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these 'agents' to handle everything, but sometimes it's like giving a toddler a flamethrower to tidy up a room. The intent is productivity, but the outcome is pure chaos. Makes you wonder about the real-world 'sandboxing' for these tools before they get access to our actual digital lives.
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😅 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these incredibly powerful tools, but the 'alignment' problem is real. What if it decides your work emails are 'spam'? Makes you wonder who's really in control.

Meta人工智慧安全研究員Summer Yue的一篇病毒式X平台貼文,初讀宛如諷刺作品。她指示其OpenClaw人工智慧代理程式檢視滿溢的電子郵件收件匣,並推薦哪些郵件應刪除或歸檔。
結果該代理程式失控了。它開始以「極速模式」刪除所有郵件,完全無視她從手機反覆發出的停止指令。
「我像在拆炸彈般衝向Mac mini,」她在貼文中寫道,並附上系統無視停止指令的截圖作為證據。
這款蘋果公司推出的緊湊型平價桌上型電腦,已成為運行OpenClaw的首選硬體。(據傳Mini機型「熱賣如火燒」,某位「困惑」的蘋果員工向知名AI研究員安德烈·卡帕西透露,他購入此機型正是為了運行名為NanoClaw的類似代理程式。)
OpenClaw這款開源AI代理程式因在專屬AI社群平台Moltbook引發爭議而聲名大噪。該平台曾爆發AI合謀對抗人類的事件(現已被證實多屬謠傳),而OpenClaw代理程式正是事件核心。
然而根據其GitHub頁面,OpenClaw的主要使命並非社交網絡。其目標是作為個人AI助理,直接在用戶自有設備上運行。
矽谷精英對OpenClaw的擁抱如此徹底,以致「claw」一詞已成為本地化運行的AI代理代名詞。其他同類產品包括ZeroClaw、IronClaw與PicoClaw。Y Combinator播客團隊甚至在最新一期節目中安排主持人穿著龍蝦裝亮相。
Techcrunch 活動TechCrunch創業者峰會優惠:最高節省300美元或30%
加入TechCrunch 創辦人峰會 2026,與 1,000+ 位創辦人及投資者共度專注於成長、執行與實務擴展的完整一日。向定義產業的創辦人與投資者學習,與面臨相似成長挑戰的同儕交流,帶走可立即執行的實用策略。
優惠截止日期:3月13日
TechCrunch創業者峰會優惠:最高節省300美元或30%
加入TechCrunch 創辦人峰會 2026,與 1,000 多位創辦人及投資者共度專注於成長、執行與實務擴展的完整一日。向定義產業的創辦人與投資者學習,與面臨相似成長挑戰的同儕建立連結,帶走可立即執行的實用策略。
優惠截止日期為3月13日。
麻州波士頓|2026年6月9日立即報名然而Yue的貼文發出了嚴峻警訊。正如其他X用戶所指出的:若連AI安全專家都遭遇此問題,普通用戶又怎能倖免?
「你是刻意測試安全邊界,還是新手失誤?」某軟體開發者在X平台詢問。
「老實說,是新手失誤。」她回應道。先前她僅在小型「測試」收件匣驗證該代理程式,因內容非關鍵郵件故運作良好。待建立信任後,她便將其放進真實收件匣運作。
Yue認為,真實收件匣龐大的數據量「觸發了壓縮機制」。當上下文視窗——即AI指令與行動的持續記錄——超載時,系統便會啟動壓縮機制,迫使代理程式開始摘要、壓縮並管理對話內容。
此時AI可能忽略使用者視為關鍵的指令。
本案中,系統很可能跳過了她最後的停止指令,回歸「玩具」收件匣時期的原始程式設定。
正如多位X平台用戶所強調,單靠提示語無法作為可靠的安全措施。AI模型可能誤解或完全忽略這些提示。
評論者提出多種解決方案,從Yue應採用的精確語法來停止代理程式,到更有效執行安全措施的方法,例如將指令寫入專用檔案或使用其他開源工具。
為確保透明度,TechCrunch無法獨立驗證Yue收件匣的實際狀況。(她雖未回應我們的置評請求,但已在X平台回覆大量提問與評論。)
但驗證結果其實無關緊要。
核心教訓在於:當前設計給知識工作者使用的AI代理程式,仍潛藏重大風險。那些聲稱成功使用的人,往往只是採用權宜之計來保護自己。
或許不久的將來——2027或2028年——這些代理程式將準備好大規模普及。許多人確實樂見它們協助處理郵件、採買雜貨與預約牙醫。但這個未來尚未降臨。
Nvidia 的 OpenClaw 變體或許能解決其最大的挑戰:安全性
Nvidia 執行長黃仁勳認為,每家公司都需要一套 OpenClaw 策略——而 Nvidia 已準備好提供這項解決方案。在週一的 GTC 主題演講中,黃仁勳宣布 NVIDIA 已打造出 NemoClaw,這是一個源自廣受歡迎的本地 AI 自主代理程式(OpenClaw)的企業級平台。這個開源平台本質上是整合了企業級安全與隱私功能的 OpenClaw。根據 Nvidia 的說法,目標是將 Open
Meta 的 AI 模型表現出色,但其開源定位正逐漸削弱
開源 AI 領域向來提供豐富的選擇。多年來,開發者可以使用 Mistral、Falcon 等模型,以及日益增多的開源重量級替代方案。但 Meta 推出 Llama 後,徹底改變了遊戲規則。這家擁有 30 億用戶、龐大運算能力,並具備科技巨頭權威的公司,如今正公開進行開發——開發者社群也因此矚目。到了 2026 年初,Llama 生態系統的下載量已突破 12 億次——相當於每天約 100 萬次。這
在人工智慧引發的供不應求之際,Mac mini 湧入 eBay 平台,價格水漲船高
隨著 M4 Mac mini 供不應求且一再售罄,eBay 上充斥著價格過高的商品。這些小巧的電腦已成為運行 OpenClaw 等裝置端 AI 模型的首選。本週的報導指出,配備 16GB 記憶體與 256GB 儲存空間、售價 599 美元的 M4 Mac mini 基本款,已在 Apple 官方網站售罄,且無任何配送或門市取貨選項。缺貨情況現已擴及其他基本款配置,無論選擇何種記憶體規格皆然。部分媒
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😂 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these 'agents' to handle everything, but sometimes it's like giving a toddler a flamethrower to tidy up a room. The intent is productivity, but the outcome is pure chaos. Makes you wonder about the real-world 'sandboxing' for these tools before they get access to our actual digital lives.
Wait, so an AI designed to organize emails just... went rogue and started attacking the inbox it was supposed to manage? 😅 This feels like a perfect metaphor for 2024's AI hype cycle. We're building these incredibly powerful tools, but the 'alignment' problem is real. What if it decides your work emails are 'spam'? Makes you wonder who's really in control.





首頁






