Name: DeepSeek-V3-0324
Rating: 1 (96 reviews)
Author: DeepSeek

Maison

Liste des modèles Al

DeepSeek-V3-0324

Ajouter la comparaison

671B

Quantité de paramètre de modèle

DeepSeek

Organisation affiliée

Source ouverte

Type de licence

24 mars 2025

Temps de libération

Site officiel

Documentation du modèle

Rapport technique

Personnalités associées

Zhenda Xie

Kai Dong

Qihao Zhu

Daya Guo

Liang Wenfeng

Introduction du modèle

DeepSeek-V3 surpasse les autres modèles open-source tels que Qwen2.5-72B et Llama-3.1-405B dans plusieurs évaluations et égale les performances des modèles propriétaires de premier plan comme GPT-4 et Claude-3.5-Sonnet.

Score complet Dialogue du langage Réserve de connaissances Association de raisonnement Calcul mathématique Écriture de code Commande suivante

Faites glisser vers la gauche et la droite pour voir plus

Capacité de compréhension du langage

Capable de comprendre des contextes complexes et de générer des phrases logiquement cohérentes, bien que parfois hors du contrôle de la tonalité.

7.5

Portée de la couverture des connaissances

Possède une connaissance fondamentale des disciplines traditionnelles, mais a une couverture limitée des champs interdisciplinaires de pointe.

8.8

Capacité de raisonnement

Incapable de maintenir des chaînes de raisonnement cohérentes, provoquant souvent une causalité inversée ou des erreurs de calcul.

5.4

Comparaison du modèle

DeepSeek-V3-0324 vs Qwen2.5-7B-Instruct Comme Qwen2, les modèles de langue Qwen2.5 prennent en charge jusqu'à 128K tokens et peuvent générer jusqu'à 8K tokens. Ils maintiennent également une prise en charge multilingue pour plus de 29 langues, y compris le chinois, l'anglais, le français, l'espagnol, le portugais, l'allemand, l'italien, le russe, le japonais, le coréen, le vietnamien, le thaï, l'arabe et bien d'autres.

DeepSeek-V3-0324 vs Hunyuan-T1-20250822 Le modèle de raisonnement profond développé indépendamment par Tencent porte le numéro de version hunyuan-t1-20250822.

DeepSeek-V3-0324 vs Spark-X1 Le modèle d'inférence Spark X1 publié par iFlytek, sur la base de tâches mathématiques nationales de premier plan, compare les performances de tâches générales telles que l'inférence, la génération de texte et la compréhension du langage avec OpenAI o1 et DeepSeek R1.

DeepSeek-V3-0324 vs Doubao-Seed-1.6-thinking-250715 La dernière version du modèle de la série seed lancé par ByteDance, qui prend en charge le mode de réflexion.

DeepSeek-V3-0324 vs Doubao-Seed-1.6-251015 (Thinking) Le modèle de raisonnement profond publié par ByteDance, qui prend en charge la commutation manuelle du raisonnement profond, et ses performances sont considérablement améliorées par rapport à doubao-1.5.

Modèle connexe

DeepSeek-V3.2 La dernière version des modèles de la série Deepseek V3.

DeepSeek-V3.2-Exp La dernière version expérimentale des modèles de la série Deepseek V3.

DeepSeek-R1-0528 La dernière version de Deepseek R1.

DeepSeek-V2-Chat-0628 DeepSeek-V2 est un modèle de langue robuste de type Mixture-of-Experts (MoE), caractérisé par un coût d'entraînement économique et une inférence efficace. Il comprend un total de 236 milliards de paramètres, dont 21 milliards sont activés pour chaque jeton. Comparé à DeepSeek 67B, DeepSeek-V2 offre des performances supérieures tout en économisant 42,5 % des coûts d'entraînement, réduisant la mémoire de cache KV de 93,3 % et augmentant la capacité maximale de génération jusqu'à 5,76 fois.

Documents pertinents

La première série dramatique AIGC de Yaoke Media, « Le mystère du bronze dans le Qinling », sort aujourd'hui avec des rôles principaux interprétés par des personnages générés par l'IA C'est aujourd'hui que sort officiellement la mini-série fantastique et policière en IA générée (AIGC) de Yaoke Media, intitulée « L'histoire secrète du bronze de Qinling ». Mettant en s

Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI Mercredi, un analyste de Wall Street a demandé directement au PDG de Microsoft, Satya Nadella, en quoi le nouveau partenariat avec OpenAI affecterait les résultats financiers de l’entreprise.Nadella a décrit ce nouvel accord comme une victoire pour

WordPress.com permet désormais à des agents IA de rédiger et de publier des articles, et bien plus encore WordPress.com, la célèbre plateforme d'hébergement et de publication Web, se tourne désormais vers les agents IA, une initiative qui pourrait bien redéfinir l'apparence et l'ergonomie du Web. La socié

Claude, l'IA expérimentale d'Anthropic, mène à bien des négociations et des transactions dans le cadre d'un test de commerce électronique Alors que l'intelligence artificielle progresse à grands pas, Anthropic a discrètement lancé vendredi dernier une expérience interne baptisée « Project Deal », visant à mettre en avant le potentiel de

DeepSeek Code s'apprête à être lancé Alors que les technologies d'IA progressent à grands pas, DeepSeek se trouve à un tournant passionnant. L'entreprise spécialisée dans l'IA a récemment annoncé avoir levé plus de 70 milliards de yuans.

Comparaison du modèle

Démarrer la comparaison