option
Maison
Liste des modèles Al
DeepSeek-R1-0528
Quantité de paramètre de modèle
671B
Quantité de paramètre de modèle
Organisation affiliée
DeepSeek
Organisation affiliée
Source ouverte
Type de licence
Temps de libération
28 mai 2025
Temps de libération

Introduction du modèle
La dernière version de Deepseek R1.
Faites glisser vers la gauche et la droite pour voir plus
Capacité de compréhension du langage Capacité de compréhension du langage
Capacité de compréhension du langage
Capable de comprendre des contextes complexes et de générer des phrases logiquement cohérentes, bien que parfois hors du contrôle de la tonalité.
8.4
Portée de la couverture des connaissances Portée de la couverture des connaissances
Portée de la couverture des connaissances
Possède une connaissance fondamentale des disciplines traditionnelles, mais a une couverture limitée des champs interdisciplinaires de pointe.
8.9
Capacité de raisonnement Capacité de raisonnement
Capacité de raisonnement
Gère bien les questions de base arithmétique et simple, mais lutte avec des problèmes abstraits.
6.0
Modèle connexe
DeepSeek-V3.2 La dernière version des modèles de la série Deepseek V3.
DeepSeek-V3.2-Exp La dernière version expérimentale des modèles de la série Deepseek V3.
DeepSeek-R1-0528 La dernière version de Deepseek R1.
DeepSeek-V3-0324 DeepSeek-V3 surpasse les autres modèles open-source tels que Qwen2.5-72B et Llama-3.1-405B dans plusieurs évaluations et égale les performances des modèles propriétaires de premier plan comme GPT-4 et Claude-3.5-Sonnet.
DeepSeek-V2-Chat-0628 DeepSeek-V2 est un modèle de langue robuste de type Mixture-of-Experts (MoE), caractérisé par un coût d'entraînement économique et une inférence efficace. Il comprend un total de 236 milliards de paramètres, dont 21 milliards sont activés pour chaque jeton. Comparé à DeepSeek 67B, DeepSeek-V2 offre des performances supérieures tout en économisant 42,5 % des coûts d'entraînement, réduisant la mémoire de cache KV de 93,3 % et augmentant la capacité maximale de génération jusqu'à 5,76 fois.
Documents pertinents
La politique rendant obligatoire l'utilisation de la recherche par IA provoque un exode, tandis que DuckDuckGo enregistre une forte augmentation du nombre d'utilisateurs Suite à l'annonce faite par Google lors de sa conférence I/O 2026 concernant une refonte complète de son moteur de recherche axée sur l'IA, de nombreux utilisateurs se sont mis à rechercher des altern
Xiaohongshu se restructure : Conan nommé président, création d'un département dédié à l'IA et d'une division internationale Rednote Le 30 avril, Xiaohongshu a adressé une note interne à l'ensemble de ses employés pour annoncer le lancement d'une nouvelle restructuration organisationnelle. Au cœur de cette évolution figure l'intégr
Le jeu « Xiaolongxia » de Tencent dépasse toutes les attentes ; l'équipe multiplie par dix sa capacité, présente ses excuses et offre des compensations Tencent a officiellement lancé WorkBuddy, un agent intelligent basé sur l'IA et adapté à tous les contextes, marquant ainsi une nouvelle étape dans la course aux applications des grands modèles, carac
Principal investisseur de Suno : la suppression des publications ne comblera pas les lacunes en matière de poursuites pour violation du droit d'auteur La plateforme de génération musicale par IA très attendue, Suno, est confrontée à une rude bataille en matière de droits d'auteur, et une remarque sans détours de son principal investisseur pourrait b
Claude Opus 4.7 fait son entrée sur le marché en misant davantage sur la fiabilité que sur l'intelligence Anthropic a maintenu un rythme soutenu cette année, en déployant de nouvelles fonctionnalités presque tous les deux jours. Le très attendu Claude Opus 4.7 vient d'être officiellement lancé, et il est
Comparaison du modèle
Démarrer la comparaison
OR