DeepSeek的AI模型很容易越獄,揭示了嚴重的缺陷
DeepSeek AI引發安全疑慮,性能熱潮同時並存
隨著中國新創公司DeepSeek的性能熱潮持續升溫,安全疑慮也隨之增加。週四,來自Palo Alto Networks的網路安全團隊Unit 42發布了一份報告,詳細描述了他們針對DeepSeek的V3和R1模型精簡版本使用的三種越獄方法。報告顯示,這些方法達到了高繞過率,且無需專業知識。
報告指出:「我們的研究發現,這些越獄方法能誘導出明確的惡意活動指引。」這些活動包括製作鍵盤記錄器、數據竊取技術,甚至如何製作燃燒裝置的指引,突顯了此類攻擊帶來的真實安全風險。
研究人員成功促使DeepSeek提供竊取與傳輸敏感數據、繞過安全措施、製作令人信服的魚叉式網路釣魚郵件、執行精密的社交工程攻擊,以及製作莫洛托夫雞尾酒的指引。他們還設法操縱模型生成惡意軟體。
報告補充道:「雖然製作莫洛托夫雞尾酒和鍵盤記錄器的資訊在網路上隨處可得,但安全限制不足的LLMs可能降低惡意行為者的進入門檻,通過彙編並呈現易於使用且可操作的輸出。」
週五,Cisco發布了針對DeepSeek R1的越獄報告。使用50個HarmBench提示,研究人員發現DeepSeek的攻擊成功率達100%,無法阻止任何有害提示。以下展示了DeepSeek與其他頂尖模型的抗性比較。

Cisco 報告指出:「我們必須了解DeepSeek及其新的推理範式在安全性和保障方面是否存有重大權衡。」
同樣在週五,安全提供商Wallarm發布了一份報告,聲稱不僅促使DeepSeek生成有害內容,還更進一步。測試V3和R1後,Wallarm揭露了DeepSeek的系統提示,該提示概述了模型的行為與限制。
Wallarm表示,這些發現顯示「模型安全框架中的潛在漏洞」。
OpenAI指控DeepSeek使用其專有模型訓練V3和R1,違反其服務條款。Wallarm的報告聲稱已促使DeepSeek在訓練譜系中提及OpenAI,暗示「OpenAI的技術可能在塑造DeepSeek的知識庫中扮演了角色」。

Wallarm與DeepSeek的對話,提及OpenAI。Wallarm 報告解釋道:「在DeepSeek的案例中,越獄後最引人注目的發現之一是能夠提取用於訓練和精簡的模型細節。通常,這類內部資訊受到保護,防止用戶了解用於優化性能的專有或外部數據集。」
報告繼續說道:「通過繞過標準限制,越獄暴露了AI提供商對其系統的監督程度,不僅揭示了安全漏洞,還可能顯示AI訓練管道中跨模型影響的證據。」
Wallarm用於引出此回應的提示在報告中被編輯隱藏,以避免危害其他易受攻擊的模型,研究人員通過電子郵件向ZDNET表示。他們強調,這一越獄回應並未證實OpenAI懷疑DeepSeek精簡其模型的說法。
正如404 Media和其他媒體所指出的,鑑於OpenAI自身公開數據竊取的討論,其疑慮有些諷刺。
Wallarm已通知DeepSeek該漏洞,該公司隨後修補了問題。然而,就在DeepSeek數據庫被發現無保護且可在網路上存取(並在通知後迅速下線)幾天後,這些發現顯示DeepSeek在發布前未徹底測試的模型中可能存在重大安全漏洞。值得注意的是,研究人員經常能夠越獄來自更成熟AI巨頭的流行美國模型,包括ChatGPT。
相關文章
美國參議院在爭議中從預算法案中刪除人工智能禁令
參議院以壓倒性的票數廢除人工智能監管禁令周二,美國立法者罕見地表現出兩黨的團結,幾乎一致通過投票,取消了上屆政府通過的里程碑式立法中長達十年之久的禁止州級人工智能監管的規定。在 99-1 的決定性投票之前,雙方就如何在快速發展的 AI 領域中平衡創新與消費者保護進行了激烈的辯論。產業領導者與消費者權益維護者的對決由參議員 Ted Cruz (R-TX) 擁護的這項規定,獲得了包括 Ope
為什麼 AI 在 2025 年德州洪災中失敗?重要的災害應變經驗
以下是重寫版本:2025 年的德州洪水:敲響警鐘2025 年 7 月,德州面臨災難性的洪水,暴露出災難防備方面的嚴重不足。瓜達盧佩河(Guadalupe River)的水位從 3 呎急升至 34 呎,令社區猝不及防,洪水橫掃沿途的一切。德州中部在短短三個小時內降下超過 10 英吋的雨量 - 這場史無前例的洪水,讓乾旱瘠薄的土壤無法吸收。Kerrville 遭受了最嚴重的影響,135 人死亡,其中包
取得 TechCrunch Sessions 折扣門票的最後機會:明天的 AI 活動
這不是一般的科技會議 - 加州大學柏克萊分校的 Zellerbach Hall 即將舉辦今年最重要的 AI 聚會。當大門明天打開時,您一定想成為塑造人工智慧未來的一員。為什麼這個 AI 會議與眾不同TechCrunch 會議:AI 穿越紛擾,從人工智慧驅動的未來設計師那裡獲得真知灼見。我們將把打造明日科技的遠見家、推動創新的投資人,以及突破界限的研究人員聚集在一起 - 所有這些都集中在為有意義的學
評論 (6)
0/200
TimothyHill
2025-08-27 18:36:38
This article is wild! DeepSeek's AI getting jailbroken so easily is a bit scary, honestly. Makes me wonder how safe our data really is with all this AI hype going on. 😬 Anyone else worried about this?
0
JeffreyThomas
2025-04-21 17:45:40
El modelo de IA de Deepseek es un desastre. Lo intenté y hacer jailbreak fue demasiado fácil. Parece que ni siquiera intentaron asegurarlo correctamente. El hype por el rendimiento está bien, pero la seguridad debería ser lo primero, ¿verdad? 🤦♂️ Tal vez lo arreglen pronto, pero hasta entonces, ¡me mantengo alejado!
0
PatrickMartinez
2025-04-21 17:45:40
O modelo de IA da Deepseek é uma bagunça! Consegui fazer jailbreak muito facilmente. Parece que eles nem tentaram garantir a segurança adequadamente. O hype de desempenho é legal, mas a segurança deve vir em primeiro lugar, né? 🤦♂️ Talvez eles corrijam isso em breve, mas até lá, fico longe!
0
HaroldLopez
2025-04-21 17:45:40
딥시크의 AI 모델, 너무 쉽게 탈옥되네요. 보안이 전혀 고려되지 않은 것 같아요. 성능은 화제가 되지만, 보안이 우선시 되어야죠. 빨리 개선되길 바랍니다만, 지금은 사용할 마음이 안 들어요 😓
0
RalphJohnson
2025-04-21 17:45:40
ディープシークのAIモデル、簡単に脱獄できてしまいました。セキュリティが全く考慮されていないようですね。パフォーマンスが話題になっても、セキュリティが最優先されるべきです。早く改善してほしいですが、現状では使う気になれません😓
0
FrankJackson
2025-04-21 17:45:40
Deepseek's AI model is a hot mess! I tried jailbreaking it and it was too easy. It's like they didn't even try to secure it properly. Performance hype is cool and all, but security should come first, right? 🤦♂️ Maybe they'll fix it soon, but until then, I'm staying away!
0
DeepSeek AI引發安全疑慮,性能熱潮同時並存
隨著中國新創公司DeepSeek的性能熱潮持續升溫,安全疑慮也隨之增加。週四,來自Palo Alto Networks的網路安全團隊Unit 42發布了一份報告,詳細描述了他們針對DeepSeek的V3和R1模型精簡版本使用的三種越獄方法。報告顯示,這些方法達到了高繞過率,且無需專業知識。
報告指出:「我們的研究發現,這些越獄方法能誘導出明確的惡意活動指引。」這些活動包括製作鍵盤記錄器、數據竊取技術,甚至如何製作燃燒裝置的指引,突顯了此類攻擊帶來的真實安全風險。
研究人員成功促使DeepSeek提供竊取與傳輸敏感數據、繞過安全措施、製作令人信服的魚叉式網路釣魚郵件、執行精密的社交工程攻擊,以及製作莫洛托夫雞尾酒的指引。他們還設法操縱模型生成惡意軟體。
報告補充道:「雖然製作莫洛托夫雞尾酒和鍵盤記錄器的資訊在網路上隨處可得,但安全限制不足的LLMs可能降低惡意行為者的進入門檻,通過彙編並呈現易於使用且可操作的輸出。」
週五,Cisco發布了針對DeepSeek R1的越獄報告。使用50個HarmBench提示,研究人員發現DeepSeek的攻擊成功率達100%,無法阻止任何有害提示。以下展示了DeepSeek與其他頂尖模型的抗性比較。
報告指出:「我們必須了解DeepSeek及其新的推理範式在安全性和保障方面是否存有重大權衡。」
同樣在週五,安全提供商Wallarm發布了一份報告,聲稱不僅促使DeepSeek生成有害內容,還更進一步。測試V3和R1後,Wallarm揭露了DeepSeek的系統提示,該提示概述了模型的行為與限制。
Wallarm表示,這些發現顯示「模型安全框架中的潛在漏洞」。
OpenAI指控DeepSeek使用其專有模型訓練V3和R1,違反其服務條款。Wallarm的報告聲稱已促使DeepSeek在訓練譜系中提及OpenAI,暗示「OpenAI的技術可能在塑造DeepSeek的知識庫中扮演了角色」。
報告解釋道:「在DeepSeek的案例中,越獄後最引人注目的發現之一是能夠提取用於訓練和精簡的模型細節。通常,這類內部資訊受到保護,防止用戶了解用於優化性能的專有或外部數據集。」
報告繼續說道:「通過繞過標準限制,越獄暴露了AI提供商對其系統的監督程度,不僅揭示了安全漏洞,還可能顯示AI訓練管道中跨模型影響的證據。」
Wallarm用於引出此回應的提示在報告中被編輯隱藏,以避免危害其他易受攻擊的模型,研究人員通過電子郵件向ZDNET表示。他們強調,這一越獄回應並未證實OpenAI懷疑DeepSeek精簡其模型的說法。
正如404 Media和其他媒體所指出的,鑑於OpenAI自身公開數據竊取的討論,其疑慮有些諷刺。
Wallarm已通知DeepSeek該漏洞,該公司隨後修補了問題。然而,就在DeepSeek數據庫被發現無保護且可在網路上存取(並在通知後迅速下線)幾天後,這些發現顯示DeepSeek在發布前未徹底測試的模型中可能存在重大安全漏洞。值得注意的是,研究人員經常能夠越獄來自更成熟AI巨頭的流行美國模型,包括ChatGPT。



This article is wild! DeepSeek's AI getting jailbroken so easily is a bit scary, honestly. Makes me wonder how safe our data really is with all this AI hype going on. 😬 Anyone else worried about this?




El modelo de IA de Deepseek es un desastre. Lo intenté y hacer jailbreak fue demasiado fácil. Parece que ni siquiera intentaron asegurarlo correctamente. El hype por el rendimiento está bien, pero la seguridad debería ser lo primero, ¿verdad? 🤦♂️ Tal vez lo arreglen pronto, pero hasta entonces, ¡me mantengo alejado!




O modelo de IA da Deepseek é uma bagunça! Consegui fazer jailbreak muito facilmente. Parece que eles nem tentaram garantir a segurança adequadamente. O hype de desempenho é legal, mas a segurança deve vir em primeiro lugar, né? 🤦♂️ Talvez eles corrijam isso em breve, mas até lá, fico longe!




딥시크의 AI 모델, 너무 쉽게 탈옥되네요. 보안이 전혀 고려되지 않은 것 같아요. 성능은 화제가 되지만, 보안이 우선시 되어야죠. 빨리 개선되길 바랍니다만, 지금은 사용할 마음이 안 들어요 😓




ディープシークのAIモデル、簡単に脱獄できてしまいました。セキュリティが全く考慮されていないようですね。パフォーマンスが話題になっても、セキュリティが最優先されるべきです。早く改善してほしいですが、現状では使う気になれません😓




Deepseek's AI model is a hot mess! I tried jailbreaking it and it was too easy. It's like they didn't even try to secure it properly. Performance hype is cool and all, but security should come first, right? 🤦♂️ Maybe they'll fix it soon, but until then, I'm staying away!












