DeepSeek dévoile un modèle d'IA rivalisant avec les systèmes de pointe

Le laboratoire chinois d'IA DeepSeek a publié deux versions préliminaires de son tout dernier grand modèle linguistique, DeepSeek V4, une mise à jour très attendue du modèle V3.2 de l'année dernière et du modèle de raisonnement R1 qui l'accompagnait, lesquels avaient eu un impact considérable au sein de la communauté de l'IA.
La société indique que DeepSeek V4 Flash et V4 Pro sont tous deux des modèles de type « mixture-of-experts », chacun disposant d'une fenêtre contextuelle d'un million de tokens, ce qui est suffisant pour traiter des bases de code ou des documents volumineux dans le cadre de requêtes. Cette méthode « mixture-of-experts » n'active qu'un sous-ensemble spécifique de paramètres par tâche afin de réduire les coûts d'inférence.
Le modèle Pro compte au total 1,6 billion de paramètres (dont 49 milliards actifs), ce qui en fait le plus grand modèle à poids ouvert disponible. Il surpasse des concurrents tels que Kimi K 2.6 de Moonshot AI (1,1 billion), M1 de MiniMax (456 milliards) et dépasse de plus du double la taille de DeepSeek V3.2 (671 milliards). Le modèle V4 Flash, plus petit, contient 284 milliards de paramètres (dont 13 milliards actifs).
DeepSeek affirme que les améliorations architecturales rendent ces deux nouveaux modèles plus efficaces et plus performants que DeepSeek V3.2, « comblant presque l'écart » avec les modèles de pointe actuels, qu'ils soient open source ou propriétaires, sur les benchmarks de raisonnement.
Le laboratoire indique que son nouveau modèle V4-Pro-Max surpasse ses homologues open source sur les benchmarks de raisonnement et dépasse les performances du GPT-5.2 et du Gemini 3.0 Pro d’OpenAI sur certaines tâches. Dans les benchmarks de concours de codage, DeepSeek affirme que les performances des deux modèles V4 sont « comparables à celles du GPT-5.4 ».
Cependant, les modèles semblent légèrement à la traîne par rapport aux modèles de pointe dans les évaluations basées sur les connaissances, en particulier lorsqu'on les compare au GPT-5.4 d'OpenAI et au dernier Google Gemini 3.1 Pro. Cet écart indique une « trajectoire de développement qui accuse un retard d'environ 3 à 6 mois par rapport aux modèles de pointe », selon le laboratoire.
Contrairement à de nombreux modèles à code source fermé qui prennent en charge la génération d'audio, de vidéo et d'images, V4 Flash et V4 Pro sont tous deux des modèles exclusivement textuels.
Un avantage clé est que DeepSeek V4 est nettement plus rentable que les modèles de pointe actuels. Le plus petit modèle, V4 Flash, est proposé à 0,14 $ par million de tokens d'entrée et 0,28 $ par million de tokens de sortie, ce qui est moins cher que le GPT-5.4 Nano, le Gemini 3.1 Flash, le GPT-5.4 Mini et le Claude Haiku 4.5. Le modèle V4 Pro, plus grand, coûte 0,145 $ par million de tokens d'entrée et 3,48 $ par million de tokens de sortie, proposant également des tarifs inférieurs à ceux de Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 et GPT-5.4.
Ce lancement intervient un jour après que les États-Unis ont accusé la Chine de se livrer à un vol de propriété intellectuelle à l'échelle industrielle auprès de laboratoires américains d'IA en utilisant des milliers de comptes proxy. DeepSeek a lui-même fait l'objet d'accusations de la part d'Anthropic et d'OpenAI de « distillation », c'est-à-dire de copie pure et simple, de leurs modèles d'IA.
Article connexe
Le modèle d'IA DeepSeek V3.2 offre des performances de haut niveau avec un coût de calcul minimal
Alors que les grandes entreprises technologiques investissent des milliards dans la puissance de calcul pour développer des modèles d'IA de pointe, la société chinoise DeepSeek a obtenu des résul
Les responsables de la sécurité appellent à une réglementation rapide de l'IA, en invoquant les risques liés à des outils tels que DeepSeek
L'inquiétude monte dans les centres d'opérations de sécurité, en particulier chez les responsables de la sécurité de l'information (CISO), avec une attention particulière pour le géant chinois de l'in
La mise à jour R1 du modèle d'IA de DeepSeek introduit une modération plus stricte du contenu, comme le révèlent les tests.
Le dernier modèle de raisonnement de la startup chinoise DeepSeek, une itération améliorée de son système R1, offre des performances exceptionnelles en matière de codage, de mathématiques et de connai
Recommandations de sujets spéciaux liés
commentaires (0)

Le laboratoire chinois d'IA DeepSeek a publié deux versions préliminaires de son tout dernier grand modèle linguistique, DeepSeek V4, une mise à jour très attendue du modèle V3.2 de l'année dernière et du modèle de raisonnement R1 qui l'accompagnait, lesquels avaient eu un impact considérable au sein de la communauté de l'IA.
La société indique que DeepSeek V4 Flash et V4 Pro sont tous deux des modèles de type « mixture-of-experts », chacun disposant d'une fenêtre contextuelle d'un million de tokens, ce qui est suffisant pour traiter des bases de code ou des documents volumineux dans le cadre de requêtes. Cette méthode « mixture-of-experts » n'active qu'un sous-ensemble spécifique de paramètres par tâche afin de réduire les coûts d'inférence.
Le modèle Pro compte au total 1,6 billion de paramètres (dont 49 milliards actifs), ce qui en fait le plus grand modèle à poids ouvert disponible. Il surpasse des concurrents tels que Kimi K 2.6 de Moonshot AI (1,1 billion), M1 de MiniMax (456 milliards) et dépasse de plus du double la taille de DeepSeek V3.2 (671 milliards). Le modèle V4 Flash, plus petit, contient 284 milliards de paramètres (dont 13 milliards actifs).
DeepSeek affirme que les améliorations architecturales rendent ces deux nouveaux modèles plus efficaces et plus performants que DeepSeek V3.2, « comblant presque l'écart » avec les modèles de pointe actuels, qu'ils soient open source ou propriétaires, sur les benchmarks de raisonnement.
Le laboratoire indique que son nouveau modèle V4-Pro-Max surpasse ses homologues open source sur les benchmarks de raisonnement et dépasse les performances du GPT-5.2 et du Gemini 3.0 Pro d’OpenAI sur certaines tâches. Dans les benchmarks de concours de codage, DeepSeek affirme que les performances des deux modèles V4 sont « comparables à celles du GPT-5.4 ».
Cependant, les modèles semblent légèrement à la traîne par rapport aux modèles de pointe dans les évaluations basées sur les connaissances, en particulier lorsqu'on les compare au GPT-5.4 d'OpenAI et au dernier Google Gemini 3.1 Pro. Cet écart indique une « trajectoire de développement qui accuse un retard d'environ 3 à 6 mois par rapport aux modèles de pointe », selon le laboratoire.
Contrairement à de nombreux modèles à code source fermé qui prennent en charge la génération d'audio, de vidéo et d'images, V4 Flash et V4 Pro sont tous deux des modèles exclusivement textuels.
Un avantage clé est que DeepSeek V4 est nettement plus rentable que les modèles de pointe actuels. Le plus petit modèle, V4 Flash, est proposé à 0,14 $ par million de tokens d'entrée et 0,28 $ par million de tokens de sortie, ce qui est moins cher que le GPT-5.4 Nano, le Gemini 3.1 Flash, le GPT-5.4 Mini et le Claude Haiku 4.5. Le modèle V4 Pro, plus grand, coûte 0,145 $ par million de tokens d'entrée et 3,48 $ par million de tokens de sortie, proposant également des tarifs inférieurs à ceux de Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 et GPT-5.4.
Ce lancement intervient un jour après que les États-Unis ont accusé la Chine de se livrer à un vol de propriété intellectuelle à l'échelle industrielle auprès de laboratoires américains d'IA en utilisant des milliers de comptes proxy. DeepSeek a lui-même fait l'objet d'accusations de la part d'Anthropic et d'OpenAI de « distillation », c'est-à-dire de copie pure et simple, de leurs modèles d'IA.
Le modèle d'IA DeepSeek V3.2 offre des performances de haut niveau avec un coût de calcul minimal
Alors que les grandes entreprises technologiques investissent des milliards dans la puissance de calcul pour développer des modèles d'IA de pointe, la société chinoise DeepSeek a obtenu des résul
Les responsables de la sécurité appellent à une réglementation rapide de l'IA, en invoquant les risques liés à des outils tels que DeepSeek
L'inquiétude monte dans les centres d'opérations de sécurité, en particulier chez les responsables de la sécurité de l'information (CISO), avec une attention particulière pour le géant chinois de l'in
La mise à jour R1 du modèle d'IA de DeepSeek introduit une modération plus stricte du contenu, comme le révèlent les tests.
Le dernier modèle de raisonnement de la startup chinoise DeepSeek, une itération améliorée de son système R1, offre des performances exceptionnelles en matière de codage, de mathématiques et de connai





Maison






