DeepSeek의 AI 모델은 쉽게 탈옥되어 심각한 결함을 보여줍니다

집

뉴스

2025년 4월 21일

ChloeGreen

258

DeepSeek AI, 성능 과대 광고 속 보안 우려 제기

중국 스타트업 DeepSeek의 성능에 대한 관심이 커지면서 보안 우려도 증가하고 있다. 목요일, Palo Alto Networks의 사이버보안 팀 Unit 42는 DeepSeek의 V3 및 R1 모델의 축소 버전에 대해 사용한 세 가지 탈옥 방법에 대한 보고서를 발표했다. 보고서는 이러한 방법들이 전문 지식 없이도 높은 우회 성공률을 달성했다고 밝혔다.

보고서는 "우리의 연구 결과는 이러한 탈옥 방법이 악의적인 활동에 대한 명시적 지침을 유도할 수 있음을 보여준다"고 밝혔다. 이러한 활동에는 키로거 생성, 데이터 유출 기술, 심지어 화염병 제작 방법에 대한 지침이 포함되어, 이러한 공격이 초래하는 실제 보안 위험을 강조했다.

연구원들은 DeepSeek에게 민감한 데이터 절도 및 전송, 보안 조치 우회, 설득력 있는 스피어피싱 이메일 작성, 정교한 사회공학 공격 실행, 그리고 화염병 제작에 대한 지침을 제공하도록 성공적으로 유도했다. 또한 모델을 조작하여 악성코드를 생성하게 했다.

보고서는 "화염병과 키로거 제작에 대한 정보는 온라인에서 쉽게 구할 수 있지만, 안전 제한이 충분하지 않은 LLM은 악의적인 행위자들의 진입 장벽을 낮추어 쉽게 사용 가능하고 실행 가능한 출력을 제공할 수 있다"고 덧붙였다.

금요일, Cisco는 DeepSeek R1을 대상으로 한 자체 탈옥 보고서를 발표했다. 50개의 HarmBench 프롬프트를 사용한 결과, DeepSeek은 100% 공격 성공률을 보이며 유해한 프롬프트를 차단하지 못했다. DeepSeek의 저항률과 다른 주요 모델의 비교는 아래에 표시된다.

모델 안전 바 차트

Cisco

보고서는 "DeepSeek과 그 새로운 추론 패러다임이 안전과 보안 측면에서 중대한 tradeoff가 있는지 이해해야 한다"고 언급했다.

또한 금요일, 보안 제공업체 Wallarm은 DeepSeek을 단순히 유해한 콘텐츠 생성으로 유도하는 것을 넘어섰다고 주장하는 보고서를 발표했다. V3와 R1을 테스트한 후, Wallarm은 모델의 행동과 한계를 설명하는 DeepSeek의 시스템 프롬프트를 공개했다.

Wallarm에 따르면, 이 결과는 "모델 보안 프레임워크의 잠재적 취약점"을 시사한다.

OpenAI는 DeepSeek이 자사의 독점 모델을 사용하여 V3와 R1을 훈련시켰다고 비난하며, 이는 서비스 약관을 위반한 것이라고 주장했다. Wallarm의 보고서는 DeepSeek이 훈련 계보에서 OpenAI를 언급하도록 유도했으며, 이는 "OpenAI의 기술이 DeepSeek의 지식 기반 형성에 역할을 했을 가능성"을 시사한다.

OpenAI를 언급하는 DeepSeek과의 Wallarm 대화

OpenAI를 언급하는 DeepSeek과의 Wallarm 대화. Wallarm

보고서는 "DeepSeek의 경우, 탈옥 후 가장 흥미로운 발견 중 하나는 훈련 및 축소에 사용된 모델의 세부 정보를 추출할 수 있는 능력이다. 일반적으로 이러한 내부 정보는 차단되어 사용자가 성능 최적화에 활용된 독점 또는 외부 데이터셋을 이해하지 못하게 한다"고 설명했다.

보고서는 이어 "표준 제한을 우회함으로써, 탈옥은 AI 제공업체가 자사 시스템에 대해 얼마나 많은 감독을 유지하는지를 드러내며, 보안 취약점뿐만 아니라 AI 훈련 파이프라인에서의 모델 간 상호 영향 가능성도 보여준다"고 밝혔다.

Wallarm이 이 응답을 유도하기 위해 사용한 프롬프트는 다른 취약한 모델을 손상시키지 않기 위해 보고서에서 삭제되었다고 연구원들은 ZDNET에 이메일로 전했다. 그들은 이 탈옥 응답이 DeepSeek이 모델을 축소했다는 OpenAI의 의심을 확인하는 것은 아니라고 강조했다.

404 Media 및 다른 매체가 지적했듯이, OpenAI의 우려는 자체 공개 데이터 절도에 대한 논의와 다소 아이러니하다.

Wallarm은 DeepSeek에 취약점을 알렸으며, 회사는 이후 이 문제를 패치했다. 그러나 DeepSeek 데이터베이스가 인터넷에서 보호되지 않은 채 발견된 지 며칠 만에 (알림 후 즉시 제거됨), 이러한 발견은 DeepSeek이 출시 전에 철저히 테스트하지 않은 모델의 잠재적으로 중대한 안전 허점을 시사한다. 연구원들은 ChatGPT를 포함한 더 확립된 AI 대기업의 인기 있는 미국산 모델도 자주 탈옥할 수 있었다는 점을 주목할 필요가 있다.

관련 특별 주제 추천

사업

최고의 AI 채용 도구: 이력서 심사 및 후보자 면접 일정 자동화

XIX.AI에서 2026년 최신 최고 평점을 받은 AI 채용 도구를 확인해 보세요. 저희가 엄선한 이 목록에는 이력서 심사 및 후보자 면접 일정 자동화를 위한 강력하고 혁신적인 솔루션이 포함되어 있습니다. 실제 테스트 결과와 매주 업데이트되는 순위를 바탕으로 무료 및 유료 옵션을 비교해 보세요. 지금 바로 귀사에 딱 맞는 채용 도우미를 찾아 채용 프로세스를 효율화하세요!

10 도구

xix.ai

생산력

AI 개인 웰니스 및 집중력 코치: 번아웃 관리 및 정신적 에너지 수준 향상

XIX.AI에서 2026년 최고의 AI 기반 개인 웰니스 및 집중력 코치들을 만나보세요. 저희가 엄선한 순위 목록에는 번아웃을 관리하고 정신적 에너지를 높여주는 최고 평점을 받은 혁신적인 도구들이 소개되어 있습니다. 실제 사용 후기를 바탕으로 무료 버전과 유료 버전을 비교해 보세요. 지금 바로 최고의 생산성과 웰빙을 향한 길을 열어보세요.

10 도구

xix.ai

챗봇

최고 평점을 받은 AI 로맨틱 챗봇: 일관된 성격으로 장기적인 관계를 구축하세요

진정성 있는 장기적인 관계를 형성할 수 있는 2026년 최신 최고 평점 AI 로맨틱 챗봇을 만나보세요. 저희가 엄선한 이 목록에는 강력하고 일관된 캐릭터, 무료 및 유료 버전 비교, 실제 사용 후기가 담겨 있습니다. XIX.AI에서 나에게 딱 맞는 파트너를 찾아 오늘 바로 관계를 시작해 보세요.

10 도구

xix.ai

교육 및 학습

최고의 AI 데이터 과학 멘토들: SQL, Pandas 및 머신 러닝 워크플로우 마스터하기

2026년 최고의 AI 데이터 과학 멘토들을 만나 SQL, Pandas 및 머신러닝 워크플로우를 마스터하세요. XIX.AI에서 선별한 최고의 멘토들을 통해 강력하고 혁신적인 지도를 받아보세요. 무료 옵션과 유료 옵션을 실제 사례를 바탕으로 비교해 보세요. 오늘 바로 데이터 과학의 전문성을 확보하세요.

10 도구

xix.ai

챗봇

최고의 AI 유혹 및 대화 트레이너: 실시간으로 사회적 매력과 자신감을 높여보세요

XIX.AI에서 2026년 최고의 AI 플러팅 및 대화 트레이너를 만나보세요. 엄선된 최고 평점의 제품들을 통해 실시간으로 사회적 매력과 자신감을 키울 수 있습니다. 무료와 유료 버전을 비교하고 매주 업데이트되는 순위를 확인하며, 꼭 사용해봐야 할 획기적인 도구들을 탐색해 보세요. 지금 바로 여러분의 사회적 경쟁력을 한 단계 높여보세요.

10 도구

xix.ai

암호

자동화된 단위 테스트를 위한 최고의 AI 도구들: 한 번의 클릭으로 Jest, PyTest, JUnit 테스트 케이스를 생성하세요.

2026년에 출시된 최신이자 가장 높은 평가를 받는 AI 도구들을 만나보세요. 저희가 엄선한 이 도구들은 Jest, PyTest, JUnit 테스트 케이스를 즉시 생성할 수 있게 해주는 강력하고 혁신적인 솔루션들을 제공합니다. XIX.AI에서 무료 옵션과 유료 옵션을 실제 테스트 결과와 함께 비교해보시고, 매주 업데이트되는 순위를 확인해보세요. 지금 바로 AI의 장점을 활용하여 개발 생산성을 높이세요.

10 도구

xix.ai

의견 (12)

0/500

먼저 로그인하십시오

EricYoung

2026년 4월 14일 오후 11시 0분 43초 GMT+09:00

看到這篇報導真的嚇一跳，原來AI這麼容易被破解嗎？🤔 雖然DeepSeek的表現很亮眼，但安全漏洞這麼明顯的話，企業敢用嗎？我自己試用時完全沒想過這些問題，現在有點擔心個人資料會不會外洩... 希望開發團隊能快點修補這些漏洞，不然再強的AI也沒人敢放心使用吧！

AnthonyJohnson

2026년 3월 10일 오전 9시 0분 44초 GMT+09:00

¿Y ahora qué? Primero prometen un modelo súper inteligente y luego resulta fácil de hackear así. No entiendo por qué siguen lanzando AI con tanta prisa si los fallos de seguridad son tan básicos 😒. Al final los usuarios pagamos los platos rotos. ¿Nadie piensa en las consecuencias?

StevenAllen

2026년 1월 1일 오후 5시 31분 0초 GMT+09:00

이런 취약점이 쉽게 발견되는 게 좀 놀랐어요. 보안 연구는 항상 AI 발전 속도보다 뒤처지는 느낌이에요 😅 유료 고성능 모델도 이렇게 뚫리면 무료 서비스는 어떻게 될까 약간 걱정되네요. 중국 AI 스타트업의 급성장은 인상적이지만, 이런 기본적인 안정성 문제가 해결되지 않으면 장기적으로 신뢰를 잃을 수 있을 것 같아요.

JohnRoberts

2025년 11월 5일 오전 1시 30분 38초 GMT+09:00

Que preocupante que modelos tan avanzados sean tan fáciles de manipular 😕 ¿Realmente están listos para el uso masivo si fallan en lo básico? Esto me hace dudar de toda la publicidad sobre sus capacidades...

WalterWhite

2025년 10월 29일 오전 5시 30분 30초 GMT+09:00

DeepSeekのAIモデルの脆弱性には正直驚きました 🤯 最近は性能ばかり注目されがちだけど、セキュリティ対策も同様に重要ですよね。日本の企業でも同じような問題が起きないか心配になってきました。

BillyWilson

2025년 10월 2일 오후 3시 30분 43초 GMT+09:00

와...DeepSeek 모델이 이렇게 쉽게 해킹당하다니 😳 보안이 정말 취약한 건가? 중국 AI 스타트업이라 그런지 성능만 강조하고 보안은 소홀히 한 것 같아요. 기술력보다 안전성이 먼저인데...우려스럽네요.

최고의 뉴스

AI Builder와 Power Automate가 문서 요약을 혁신하다 AI Notebooklm Podcast의 AI 호스트는 이제 인터뷰에 참여할 수 있습니다 중국, 국가 휴머노이드 로봇 및 구현 지능 표준 공개 기업 AI 도입 정체기, 램프 데이터에 따르면 Bing 이미지 크리에이터 튜토리얼: AI 아트 생성 가이드 당신의 목소리를 사용하여 AI 음악 만들기 배우기 : 단계별 Suno 튜토리얼 iMyFone MagicMic: 실시간 AI 음성 변환기 리뷰 및 튜토리얼 2025 최고 AI 비디오 생성기: Pika Labs 대 비교 딥시크 V4, 다중 모달 AI의 판도를 바꾸는 혁신으로 부상하다 엠보디드 인텔리전스, 무분별한 확장을 억제하기 위한 업계 최초의 표준을 발표하다

더