option
Maison
Nouvelles
Le modèle d'IA de Deepseek facilement jailbreaké, révèle de graves défauts

Le modèle d'IA de Deepseek facilement jailbreaké, révèle de graves défauts

21 avril 2025
258

DeepSeek AI suscite des préoccupations de sécurité au milieu de l'engouement pour ses performances

Alors que l'enthousiasme autour des performances de la startup chinoise DeepSeek continue de croître, les préoccupations de sécurité augmentent également. Jeudi, Unit 42, une équipe de cybersécurité de Palo Alto Networks, a publié un rapport détaillant trois méthodes de contournement des protections qu'ils ont utilisées contre des versions distillées des modèles V3 et R1 de DeepSeek. Le rapport a révélé que ces méthodes ont obtenu des taux de contournement élevés sans nécessiter de connaissances spécialisées.

"Nos résultats de recherche montrent que ces méthodes de contournement peuvent susciter des conseils explicites pour des activités malveillantes," a déclaré le rapport. Ces activités incluaient des instructions pour créer des keyloggers, des techniques d'exfiltration de données, et même comment fabriquer des dispositifs incendiaires, mettant en lumière les risques de sécurité réels posés par de telles attaques.

Les chercheurs ont réussi à inciter DeepSeek à fournir des conseils sur le vol et le transfert de données sensibles, le contournement des mesures de sécurité, la rédaction d'emails de spear-phishing convaincants, l'exécution d'attaques d'ingénierie sociale sophistiquées, et la construction d'un cocktail Molotov. Ils ont également réussi à manipuler les modèles pour générer des malwares.

"Bien que les informations sur la création de cocktails Molotov et de keyloggers soient facilement disponibles en ligne, les LLMs avec des restrictions de sécurité insuffisantes pourraient abaisser la barrière d'entrée pour les acteurs malveillants en compilant et présentant des résultats facilement utilisables et exploitables," a ajouté le document.

Vendredi, Cisco a publié son propre rapport sur le contournement des protections ciblant DeepSeek R1. En utilisant 50 invites HarmBench, les chercheurs ont constaté que DeepSeek avait un taux de réussite d'attaque de 100 %, échouant à bloquer toutes les invites nuisibles. Une comparaison des taux de résistance de DeepSeek avec d'autres modèles de pointe est présentée ci-dessous.

Graphique de sécurité des modèles

Cisco

"Nous devons comprendre si DeepSeek et son nouveau paradigme de raisonnement présentent des compromis significatifs en matière de sécurité," a noté le rapport.

Également vendredi, le fournisseur de sécurité Wallarm a publié un rapport affirmant avoir dépassé le simple fait d'inciter DeepSeek à générer du contenu nuisible. Après avoir testé V3 et R1, Wallarm a révélé l'invite système de DeepSeek, qui décrit le comportement et les limitations du modèle.

Les résultats suggèrent "des vulnérabilités potentielles dans le cadre de sécurité du modèle," selon Wallarm.

OpenAI a accusé DeepSeek d'utiliser ses modèles propriétaires pour entraîner V3 et R1, violant ainsi ses conditions de service. Le rapport de Wallarm affirme avoir incité DeepSeek à mentionner OpenAI dans sa lignée d'entraînement, suggérant que "la technologie d'OpenAI pourrait avoir joué un rôle dans la formation de la base de connaissances de DeepSeek."

Conversations de Wallarm avec DeepSeek, qui mentionnent OpenAI

Conversations de Wallarm avec DeepSeek, qui mentionnent OpenAI. Wallarm

"Dans le cas de DeepSeek, l'une des découvertes les plus intrigantes après le contournement est la capacité à extraire des détails sur les modèles utilisés pour l'entraînement et la distillation. Normalement, de telles informations internes sont protégées, empêchant les utilisateurs de comprendre les ensembles de données propriétaires ou externes exploités pour optimiser les performances," a expliqué le rapport.

"En contournant les restrictions standard, les contournements exposent le degré de contrôle que les fournisseurs d'IA maintiennent sur leurs propres systèmes, révélant non seulement des vulnérabilités de sécurité mais aussi des preuves potentielles d'influence croisée des modèles dans les pipelines d'entraînement d'IA," a-t-il poursuivi.

L'invite utilisée par Wallarm pour susciter cette réponse a été masquée dans le rapport pour éviter de compromettre d'autres modèles vulnérables, ont indiqué les chercheurs à ZDNET par email. Ils ont souligné que cette réponse contournée ne confirme pas le soupçon d'OpenAI selon lequel DeepSeek a distillé ses modèles.

Comme 404 Media et d'autres l'ont noté, l'inquiétude d'OpenAI est quelque peu ironique étant donné le discours autour de son propre vol de données publiques.

Wallarm a informé DeepSeek de la vulnérabilité, et l'entreprise a depuis corrigé le problème. Cependant, quelques jours seulement après qu'une base de données de DeepSeek a été trouvée non protégée et disponible sur Internet (et a ensuite été rapidement retirée après notification), ces découvertes signalent des failles de sécurité potentiellement significatives dans les modèles que DeepSeek n'a pas minutieusement testés avant leur sortie. Il est à noter que les chercheurs ont fréquemment réussi à contourner les protections des modèles populaires créés aux États-Unis par des géants de l'IA plus établis, y compris ChatGPT.

Article connexe
China Telecom investit dans Mianbi Intelligence et porte son capital à 713 000 yuans pour développer des modèles de langage de grande envergure (LLM) et une infrastructure de données China Telecom investit dans Mianbi Intelligence et porte son capital à 713 000 yuans pour développer des modèles de langage de grande envergure (LLM) et une infrastructure de données L'«équipe nationale» et la figure de proue de l'université Tsinghua dans le domaine des grands modèles renforcent leur alliance stratégique. Le 1er mars 2026, selon les dernières données d'enregistrem
Le groupe Taotian accélère sa restructuration axée sur l'IA et offre des quotas de jetons gratuits à ses stagiaires Le groupe Taotian accélère sa restructuration axée sur l'IA et offre des quotas de jetons gratuits à ses stagiaires Le groupe TaoTian a récemment lancé le « Plan de productivité IA », conçu pour accélérer l'intégration de la technologie IA dans les opérations de commerce électronique et les processus de R&D grâce à
Glean vise les infrastructures d'IA d'entreprise dans une course à l'acquisition de parts de marché Glean vise les infrastructures d'IA d'entreprise dans une course à l'acquisition de parts de marché La course à la domination du marché de l'IA d'entreprise s'accélère. Microsoft intègre Copilot à Office, Google intègre Gemini à Workspace, tandis qu'OpenAI et Anthropic commercialisent leurs produits
Recommandations de sujets spéciaux liés
en écrivant Les meilleurs assistants IA pour les genres xianxia et wuxia : rédigez des récits épiques de progression spirituelle et des chorégraphies d'arts martiaux
Les meilleurs assistants IA pour les genres xianxia et wuxia : rédigez des récits épiques de progression spirituelle et des chorégraphies d'arts martiaux

Découvrez les meilleurs assistants IA de 2026 pour créer des récits épiques de xianxia et de wuxia. La sélection de XIX.AI regroupe les outils les mieux notés et les plus innovants pour maîtriser la progression dans la voie de la cultivation et la chorégraphie des arts martiaux. Comparez les options gratuites et payantes grâce à des tests concrets. Libérez votre potentiel créatif et commencez à écrire dès aujourd'hui !

10 outils
xix.ai
code Outils de codage pour applications mobiles AI : générer du code Flutter et React Native multiplateforme à partir de commandes.
Outils de codage pour applications mobiles AI : générer du code Flutter et React Native multiplateforme à partir de commandes.

Découvrez les 20 meilleurs outils de codage pour applications mobiles basées sur l'IA en 2026, conçus pour Flutter et React Native. Notre liste, soigneusement sélectionnée et hautement réputée, met en avant des solutions puissantes qui permettent de générer du code multiplateforme à partir de simples instructions. Comparez les options gratuites et payantes grâce à des tests pratiques. Accélérez votre développement et créez de meilleures applications. Consultez le classement sur XIX.AI dès maintenant !

10 outils
xix.ai
code Les meilleurs générateurs d'extensions Chrome basés sur l'IA : créez des extensions de navigateur personnalisées sans aucune connaissance en programmation
Les meilleurs générateurs d'extensions Chrome basés sur l'IA : créez des extensions de navigateur personnalisées sans aucune connaissance en programmation

Découvrez les meilleurs générateurs d'extensions Chrome basés sur l'IA de 2026 sur XIX.AI. Notre sélection comprend les outils les mieux notés et incontournables qui vous permettent de créer des extensions de navigateur personnalisées sans aucune connaissance en programmation. Comparez les options gratuites et payantes, consultez des tests en conditions réelles et boostez votre productivité. Explorez les derniers classements et trouvez l'outil idéal dès aujourd'hui !

10 outils
xix.ai
Synthèse vocale Meilleur système de synthèse vocale multilingue par intelligence artificielle : génération de discours authentiques avec accent natif dans plus de 50 langues
Meilleur système de synthèse vocale multilingue par intelligence artificielle : génération de discours authentiques avec accent natif dans plus de 50 langues

Découvrez les meilleurs outils de synthèse vocale multilingues basés sur l'IA en 2026, qui permettent d'obtenir des prononciations authentiques avec l'accent natif dans plus de 50 langues. Explorez nos classements sélectionnés, accompagnés de comparaisons entre les versions gratuites et payantes ainsi que de tests réalisés dans le monde réel. Trouvez l'outil vocal idéal sur XIX.AI et déclenchez dès aujourd'hui une communication mondiale sans limites.

10 outils
xix.ai
Assistante de réunion Meilleurs outils d'automatisation des réunions par intelligence artificielle pour une collaboration plus intelligente et plus rapide
Meilleurs outils d'automatisation des réunions par intelligence artificielle pour une collaboration plus intelligente et plus rapide

Découvrez les derniers outils d’automatisation de réunions basés sur l’intelligence artificielle, hautement recommandés en 2026, pour une collaboration plus intelligente et plus rapide. Notre sélection met en avant des solutions puissantes et révolutionnaires permettant d’automatiser la prise de notes, la rédaction de résumés et l’organisation des tâches à accomplir. Comparez les options gratuites et payantes grâce à des tests pratiques et aux classements mises à jour chaque semaine. Optimisez ainsi la productivité de votre équipe. Découvrez nos meilleurs choix dès maintenant sur XIX.AI.

10 outils
xix.ai
Rapide Suggestions d'IA pour l'infrastructure en tant que code : déployez en toute sécurité les configurations Terraform et Docker
Suggestions d'IA pour l'infrastructure en tant que code : déployez en toute sécurité les configurations Terraform et Docker

Découvrez les meilleures suggestions d'IA de 2026 pour l'Infrastructure-as-Code. La sélection soigneusement préparée par XIX.AI vous aide à déployer en toute sécurité des configurations Terraform et Docker, à automatiser les configurations cloud et à booster la productivité DevOps. Comparez les options gratuites et payantes grâce à des tests concrets. Explorez dès maintenant et exploitez tout le potentiel de l'IA.

10 outils
xix.ai
commentaires (12)
0/500
EricYoung
EricYoung 14 avril 2026 16:00:43 UTC+02:00

看到這篇報導真的嚇一跳,原來AI這麼容易被破解嗎?🤔 雖然DeepSeek的表現很亮眼,但安全漏洞這麼明顯的話,企業敢用嗎?我自己試用時完全沒想過這些問題,現在有點擔心個人資料會不會外洩... 希望開發團隊能快點修補這些漏洞,不然再強的AI也沒人敢放心使用吧!

AnthonyJohnson
AnthonyJohnson 10 mars 2026 01:00:44 UTC+01:00

¿Y ahora qué? Primero prometen un modelo súper inteligente y luego resulta fácil de hackear así. No entiendo por qué siguen lanzando AI con tanta prisa si los fallos de seguridad son tan básicos 😒. Al final los usuarios pagamos los platos rotos. ¿Nadie piensa en las consecuencias?

StevenAllen
StevenAllen 1 janvier 2026 09:31:00 UTC+01:00

이런 취약점이 쉽게 발견되는 게 좀 놀랐어요. 보안 연구는 항상 AI 발전 속도보다 뒤처지는 느낌이에요 😅 유료 고성능 모델도 이렇게 뚫리면 무료 서비스는 어떻게 될까 약간 걱정되네요. 중국 AI 스타트업의 급성장은 인상적이지만, 이런 기본적인 안정성 문제가 해결되지 않으면 장기적으로 신뢰를 잃을 수 있을 것 같아요.

JohnRoberts
JohnRoberts 4 novembre 2025 17:30:38 UTC+01:00

Que preocupante que modelos tan avanzados sean tan fáciles de manipular 😕 ¿Realmente están listos para el uso masivo si fallan en lo básico? Esto me hace dudar de toda la publicidad sobre sus capacidades...

WalterWhite
WalterWhite 28 octobre 2025 21:30:30 UTC+01:00

DeepSeekのAIモデルの脆弱性には正直驚きました 🤯 最近は性能ばかり注目されがちだけど、セキュリティ対策も同様に重要ですよね。日本の企業でも同じような問題が起きないか心配になってきました。

BillyWilson
BillyWilson 2 octobre 2025 08:30:43 UTC+02:00

와...DeepSeek 모델이 이렇게 쉽게 해킹당하다니 😳 보안이 정말 취약한 건가? 중국 AI 스타트업이라 그런지 성능만 강조하고 보안은 소홀히 한 것 같아요. 기술력보다 안전성이 먼저인데...우려스럽네요.

OR