option
Maison
Liste des modèles Al
DeepSeek-V2-Chat-0628
Quantité de paramètre de modèle
236B
Quantité de paramètre de modèle
Organisation affiliée
DeepSeek
Organisation affiliée
Source ouverte
Type de licence
Temps de libération
6 mai 2024
Temps de libération
Introduction du modèle
DeepSeek-V2 est un modèle de langue robuste de type Mixture-of-Experts (MoE), caractérisé par un coût d'entraînement économique et une inférence efficace. Il comprend un total de 236 milliards de paramètres, dont 21 milliards sont activés pour chaque jeton. Comparé à DeepSeek 67B, DeepSeek-V2 offre des performances supérieures tout en économisant 42,5 % des coûts d'entraînement, réduisant la mémoire de cache KV de 93,3 % et augmentant la capacité maximale de génération jusqu'à 5,76 fois.
Faites glisser vers la gauche et la droite pour voir plus
Capacité de compréhension du langage Capacité de compréhension du langage
Capacité de compréhension du langage
Fait souvent des erreurs de jugement sémantique, conduisant à des déconnexions logiques évidentes dans les réponses.
4.6
Portée de la couverture des connaissances Portée de la couverture des connaissances
Portée de la couverture des connaissances
Possède une connaissance fondamentale des disciplines traditionnelles, mais a une couverture limitée des champs interdisciplinaires de pointe.
7.8
Capacité de raisonnement Capacité de raisonnement
Capacité de raisonnement
Incapable de maintenir des chaînes de raisonnement cohérentes, provoquant souvent une causalité inversée ou des erreurs de calcul.
4.7
Modèle connexe
DeepSeek-V2.5 DeepSeek-V2.5 est une version mise à jour combinant DeepSeek-V2-Chat et DeepSeek-Coder-V2-Instruct. Le nouveau modèle intègre les capacités générales et de codage des deux versions précédentes.
DeepSeek-V3-0324 DeepSeek-V3 surpasse d'autres modèles open source tels que Qwen2.5-72B et Llama-3.1-405B dans plusieurs évaluations et égale les performances des meilleurs modèles propriétaires comme GPT-4 et Claude-3.5-Sonnet.
DeepSeek-V2-Lite-Chat DeepSeek-V2, un modèle de langue Mixture-of-Experts (MoE) puissant présenté par DeepSeek, DeepSeek-V2-Lite est une version allégée de celui-ci.
DeepSeek-V2-Chat DeepSeek-V2 est un modèle linguistique robuste du type Mixture-of-Experts (MoE), caractérisé par un entraînement économique et une inférence efficace. Il comporte 236 milliards de paramètres au total, dont 21 milliards sont activés pour chaque jeton. Comparé à DeepSeek 67B, DeepSeek-V2 offre des performances supérieures tout en économisant 42.5 % des coûts d'entraînement, réduisant la mémoire cache KV de 93.3 % et augmentant le débit maximal de génération de 5.76 fois.
DeepSeek-R1 DeepSeek-R1 est un modèle entraîné via un apprentissage par renforcement (RL) à grande échelle sans utiliser de mise au point supervisée (SFT) comme étape initiale. Ses performances dans les tâches mathématiques, de codage et de raisonnement sont comparables à celles d'OpenAI-o1.
Documents pertinents
Éducation alimentée par l'IA : Révolutionner l'apprentissage à tous les niveaux L'intelligence artificielle (IA) transforme l'éducation en fournissant des outils innovants pour engager les élèves et personnaliser l'apprentissage. Cet article examine comment les éducateurs peuvent
AI vs. Écrivains humains : Les machines peuvent-elles surpasser la créativité ? Dans une ère axée sur le contenu, le débat sur la capacité de l'intelligence artificielle (AI) à surpasser les écrivains humains s'intensifie. L'AI offre rapidité et économies de coûts, mais les humai
Les idoles IA révolutionnent le divertissement avec des performances virtuelles Le paysage du divertissement se transforme avec l'essor des idoles IA, des performeurs virtuels alimentés par l'intelligence artificielle. Ces stars numériques captivent les publics mondiaux grâce à u
Améliorer la précision de l'extraction d'emails par IA : Stratégies clés révélées L'utilisation de l'IA pour extraire des adresses email des conversations augmente l'efficacité, mais la précision reste un défi majeur pour les développeurs. Ce guide explore des stratégies éprouvées
Pages de coloriage alimentées par l'IA : Créez des designs époustouflants facilement Découvrez une plateforme IA innovante qui transforme la création de pages de coloriage captivantes. Parfait pour les artistes, les éducateurs ou les passionnés, cet outil offre une interface intuitive
Comparaison du modèle
Démarrer la comparaison
Retour en haut
OR