option
Quantité de paramètre de modèle
132B
Quantité de paramètre de modèle
Organisation affiliée
DataBricks
Organisation affiliée
Source ouverte
Type de licence
Temps de libération
26 mars 2024
Temps de libération
Introduction du modèle
DBRX-Instruct est un modèle MoE entraîné depuis zéro par DataBricks, utilisant un mécanisme de sélection de 16 experts choisissant 4, avec un nombre de paramètres actifs de 36B. Il est pré-entraîné sur 12T de tokens, avec une prise en charge du contexte de 32K.
Faites glisser vers la gauche et la droite pour voir plus
Capacité de compréhension du langage Capacité de compréhension du langage
Capacité de compréhension du langage
Fait souvent des erreurs de jugement sémantique, conduisant à des déconnexions logiques évidentes dans les réponses.
3.8
Portée de la couverture des connaissances Portée de la couverture des connaissances
Portée de la couverture des connaissances
A des angles morts de connaissances importantes, montrant souvent des erreurs factuelles et répétant des informations obsolètes.
5.9
Capacité de raisonnement Capacité de raisonnement
Capacité de raisonnement
Incapable de maintenir des chaînes de raisonnement cohérentes, provoquant souvent une causalité inversée ou des erreurs de calcul.
2.6
Modèle connexe
DBRX-Instruct DBRX-Instruct est un modèle MoE entraîné depuis zéro par DataBricks, utilisant un mécanisme de sélection de 16 experts choisissant 4, avec un compteur de paramètres actifs de 36B. Il est pré-entraîné sur 12T de tokens, avec un contexte de 32K.
Qwen2.5-7B-Instruct Comme Qwen2, les modèles de langue Qwen2.5 prennent en charge jusqu'à 128K tokens et peuvent générer jusqu'à 8K tokens. Ils maintiennent également une prise en charge multilingue pour plus de 29 langues, y compris le chinois, l'anglais, le français, l'espagnol, le portugais, l'allemand, l'italien, le russe, le japonais, le coréen, le vietnamien, le thaï, l'arabe et bien d'autres.
Hunyuan-T1-20250822 Le modèle de raisonnement profond développé indépendamment par Tencent porte le numéro de version hunyuan-t1-20250822.
Spark-X1 Le modèle d'inférence Spark X1 publié par iFlytek, sur la base de tâches mathématiques nationales de premier plan, compare les performances de tâches générales telles que l'inférence, la génération de texte et la compréhension du langage avec OpenAI o1 et DeepSeek R1.
Doubao-Seed-1.6-thinking-250715 La dernière version du modèle de la série seed lancé par ByteDance, qui prend en charge le mode de réflexion.
Documents pertinents
Meta AI répond désormais aux messages des acheteurs sur Facebook Marketplace Facebook Marketplace lance de nouvelles fonctionnalités basées sur l'IA de Meta, notamment des réponses automatiques aux demandes des acheteurs, a annoncé jeudi l'entreprise. La plateforme u
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Google dévoile les carnets Gemini, qui associent NotebookLM à une base de connaissances personnelle Google a récemment lancé une fonctionnalité « Notebooks » pour Gemini, conçue pour aider les utilisateurs à gérer des projets complexes en créant une base de connaissances personnalisée. Cette mise à
Luma AI dévoile Uni-1, un modèle autorégressif capable de générer simultanément du texte et des pixels Luma Labs a lancé le 23 mars son modèle de génération d'images Uni-1, qui constitue le premier modèle de l'entreprise accessible au public et basé sur l'architecture Unified Intelligenc
Xinzhou Wu, de NVIDIA : « Le moment ChatGPT de la conduite autonome est arrivé, la production en série de véhicules de niveau 4 n'est plus un rêve » Dans le domaine en pleine évolution de l'IA physique, la conduite autonome est souvent considérée comme le premier défi majeur à relever. Récemment, Wu Xinzhou, vice-président de NVIDIA, a présen
Comparaison du modèle
Démarrer la comparaison
OR