DeepSeek的AI模型很容易越獄，揭示了嚴重的缺陷

首頁

新聞

2025-04-21

ChloeGreen

DeepSeek AI引發安全疑慮，性能熱潮同時並存

隨著中國新創公司DeepSeek的性能熱潮持續升溫，安全疑慮也隨之增加。週四，來自Palo Alto Networks的網路安全團隊Unit 42發布了一份報告，詳細描述了他們針對DeepSeek的V3和R1模型精簡版本使用的三種越獄方法。報告顯示，這些方法達到了高繞過率，且無需專業知識。

報告指出：「我們的研究發現，這些越獄方法能誘導出明確的惡意活動指引。」這些活動包括製作鍵盤記錄器、數據竊取技術，甚至如何製作燃燒裝置的指引，突顯了此類攻擊帶來的真實安全風險。

研究人員成功促使DeepSeek提供竊取與傳輸敏感數據、繞過安全措施、製作令人信服的魚叉式網路釣魚郵件、執行精密的社交工程攻擊，以及製作莫洛托夫雞尾酒的指引。他們還設法操縱模型生成惡意軟體。

報告補充道：「雖然製作莫洛托夫雞尾酒和鍵盤記錄器的資訊在網路上隨處可得，但安全限制不足的LLMs可能降低惡意行為者的進入門檻，通過彙編並呈現易於使用且可操作的輸出。」

週五，Cisco發布了針對DeepSeek R1的越獄報告。使用50個HarmBench提示，研究人員發現DeepSeek的攻擊成功率達100%，無法阻止任何有害提示。以下展示了DeepSeek與其他頂尖模型的抗性比較。

模型安全柱狀圖

Cisco

報告指出：「我們必須了解DeepSeek及其新的推理範式在安全性和保障方面是否存有重大權衡。」

同樣在週五，安全提供商Wallarm發布了一份報告，聲稱不僅促使DeepSeek生成有害內容，還更進一步。測試V3和R1後，Wallarm揭露了DeepSeek的系統提示，該提示概述了模型的行為與限制。

Wallarm表示，這些發現顯示「模型安全框架中的潛在漏洞」。

OpenAI指控DeepSeek使用其專有模型訓練V3和R1，違反其服務條款。Wallarm的報告聲稱已促使DeepSeek在訓練譜系中提及OpenAI，暗示「OpenAI的技術可能在塑造DeepSeek的知識庫中扮演了角色」。

Wallarm與DeepSeek的對話，提及OpenAI

Wallarm與DeepSeek的對話，提及OpenAI。Wallarm

報告解釋道：「在DeepSeek的案例中，越獄後最引人注目的發現之一是能夠提取用於訓練和精簡的模型細節。通常，這類內部資訊受到保護，防止用戶了解用於優化性能的專有或外部數據集。」

報告繼續說道：「通過繞過標準限制，越獄暴露了AI提供商對其系統的監督程度，不僅揭示了安全漏洞，還可能顯示AI訓練管道中跨模型影響的證據。」

Wallarm用於引出此回應的提示在報告中被編輯隱藏，以避免危害其他易受攻擊的模型，研究人員通過電子郵件向ZDNET表示。他們強調，這一越獄回應並未證實OpenAI懷疑DeepSeek精簡其模型的說法。

正如404 Media和其他媒體所指出的，鑑於OpenAI自身公開數據竊取的討論，其疑慮有些諷刺。

Wallarm已通知DeepSeek該漏洞，該公司隨後修補了問題。然而，就在DeepSeek數據庫被發現無保護且可在網路上存取（並在通知後迅速下線）幾天後，這些發現顯示DeepSeek在發布前未徹底測試的模型中可能存在重大安全漏洞。值得注意的是，研究人員經常能夠越獄來自更成熟AI巨頭的流行美國模型，包括ChatGPT。

使用 Creator Pro AI 和 ChatGPT 最佳化促進業務成長在現今競爭激烈的商業環境中，人工智慧解決方案已從選購升級轉變為重要的營運資產。想像一下，您可以使用全面的人工智慧工具包，其中每個專門的應用程式都能精準地滿足特定的業務需求。這就是 Creator Pro AI 所提供的現實 - 一個革命性的系統，重新定義 AI 協作並改變例行業務流程。主要優勢Creator Pro AI 提供一套最佳化的工具，可在 ChatGPT 的框架內無縫運作。它提高了行銷、

掌握 AI 統籌：將混亂轉變為流暢的工作流程企業對於 AI 代理的採用日益增加，因此急需強大的協調解決方案。隨著企業從單一代理實作進展到複雜的多代理生態系統，建立有效的管理架構對於長期的成功和互通性變得至關重要。不斷演進的 AI 協調環境隨著 AI 應用的加速，企業現在面臨著提供不同方法的協調供應商所組成的競爭市場。領先的解決方案涵蓋了從基於提示的框架到全面的端對端系統，包括 LangChain、LlamaIndex、Crew AI、Mi

商業智慧 vs. 資料分析：瞭解核心差異雖然商業智慧 (BI) 和資料分析 (DA) 經常被一起提及，但它們在資料驅動的組織中卻有不同的用途。本指南將清楚區分這些關鍵學科，檢視它們對企業策略和卓越營運的獨特貢獻。我們將探討掌握這兩種方法如何讓企業達到更高的資料成熟度和可持續的競爭優勢。重點商業智慧 (BI) 和資料分析 (DA) 專家協力實現以資料為依據的商業決策先進的資料成熟度可釋放轉型的組織洞察力BI 以開發用於持續追蹤績效的互動儀

評論 (7)

0/200

提交

BillyWilson

2025-10-02 14:30:43

와...DeepSeek 모델이 이렇게 쉽게 해킹당하다니 😳 보안이 정말 취약한 건가? 중국 AI 스타트업이라 그런지 성능만 강조하고 보안은 소홀히 한 것 같아요. 기술력보다 안전성이 먼저인데...우려스럽네요.

TimothyHill

2025-08-27 18:36:38

This article is wild! DeepSeek's AI getting jailbroken so easily is a bit scary, honestly. Makes me wonder how safe our data really is with all this AI hype going on. 😬 Anyone else worried about this?

JeffreyThomas

2025-04-21 17:45:40

El modelo de IA de Deepseek es un desastre. Lo intenté y hacer jailbreak fue demasiado fácil. Parece que ni siquiera intentaron asegurarlo correctamente. El hype por el rendimiento está bien, pero la seguridad debería ser lo primero, ¿verdad? 🤦‍♂️ Tal vez lo arreglen pronto, pero hasta entonces, ¡me mantengo alejado!

PatrickMartinez

2025-04-21 17:45:40

O modelo de IA da Deepseek é uma bagunça! Consegui fazer jailbreak muito facilmente. Parece que eles nem tentaram garantir a segurança adequadamente. O hype de desempenho é legal, mas a segurança deve vir em primeiro lugar, né? 🤦‍♂️ Talvez eles corrijam isso em breve, mas até lá, fico longe!

HaroldLopez

2025-04-21 17:45:40

딥시크의 AI 모델, 너무 쉽게 탈옥되네요. 보안이 전혀 고려되지 않은 것 같아요. 성능은 화제가 되지만, 보안이 우선시 되어야죠. 빨리 개선되길 바랍니다만, 지금은 사용할 마음이 안 들어요 😓

RalphJohnson

2025-04-21 17:45:40

ディープシークのAIモデル、簡単に脱獄できてしまいました。セキュリティが全く考慮されていないようですね。パフォーマンスが話題になっても、セキュリティが最優先されるべきです。早く改善してほしいですが、現状では使う気になれません😓

頭號新聞

2025頂級AI影片生成器：Pika Labs與其他對比 Gemini 2.5 Pro現在比Claude，GPT-4O更便宜，更便宜 AI Builder和Power Automate革新文件摘要 AI配音：真實聲音創作終極指南 Cambium的AI將垃圾木頭變成木材 Duolingo轉用能量系統 Openai增強了AI語音助手以進行更好的聊天如何確保您的數據值得信賴AI集成獲得一年Perplexity Pro訂閱的兩種免費方法 NotebookLM在全球範圍內擴展，添加幻燈片並增強了事實檢查

精選