option
Quantité de paramètre de modèle
132B
Quantité de paramètre de modèle
Organisation affiliée
DataBricks
Organisation affiliée
Source ouverte
Type de licence
Temps de libération
26 mars 2024
Temps de libération
Introduction du modèle
DBRX-Instruct est un modèle MoE entraîné depuis zéro par DataBricks, utilisant un mécanisme de sélection de 16 experts choisissant 4, avec un nombre de paramètres actifs de 36B. Il est pré-entraîné sur 12T de tokens, avec une prise en charge du contexte de 32K.
Faites glisser vers la gauche et la droite pour voir plus
Capacité de compréhension du langage Capacité de compréhension du langage
Capacité de compréhension du langage
Fait souvent des erreurs de jugement sémantique, conduisant à des déconnexions logiques évidentes dans les réponses.
3.8
Portée de la couverture des connaissances Portée de la couverture des connaissances
Portée de la couverture des connaissances
A des angles morts de connaissances importantes, montrant souvent des erreurs factuelles et répétant des informations obsolètes.
5.9
Capacité de raisonnement Capacité de raisonnement
Capacité de raisonnement
Incapable de maintenir des chaînes de raisonnement cohérentes, provoquant souvent une causalité inversée ou des erreurs de calcul.
2.6
Modèle connexe
DBRX-Instruct DBRX-Instruct est un modèle MoE entraîné depuis zéro par DataBricks, utilisant un mécanisme de sélection de 16 experts choisissant 4, avec un compteur de paramètres actifs de 36B. Il est pré-entraîné sur 12T de tokens, avec un contexte de 32K.
Qwen2.5-7B-Instruct Comme Qwen2, les modèles de langue Qwen2.5 prennent en charge jusqu'à 128K tokens et peuvent générer jusqu'à 8K tokens. Ils maintiennent également une prise en charge multilingue pour plus de 29 langues, y compris le chinois, l'anglais, le français, l'espagnol, le portugais, l'allemand, l'italien, le russe, le japonais, le coréen, le vietnamien, le thaï, l'arabe et bien d'autres.
Hunyuan-T1-20250822 Le modèle de raisonnement profond développé indépendamment par Tencent porte le numéro de version hunyuan-t1-20250822.
Spark-X1 Le modèle d'inférence Spark X1 publié par iFlytek, sur la base de tâches mathématiques nationales de premier plan, compare les performances de tâches générales telles que l'inférence, la génération de texte et la compréhension du langage avec OpenAI o1 et DeepSeek R1.
Doubao-Seed-1.6-251015 (Thinking) Le modèle de raisonnement profond publié par ByteDance, qui prend en charge la commutation manuelle du raisonnement profond, et ses performances sont considérablement améliorées par rapport à doubao-1.5.
Documents pertinents
China Telecom investit dans Mianbi Intelligence et porte son capital à 713 000 yuans pour développer des modèles de langage de grande envergure (LLM) et une infrastructure de données L'«équipe nationale» et la figure de proue de l'université Tsinghua dans le domaine des grands modèles renforcent leur alliance stratégique. Le 1er mars 2026, selon les dernières données d'enregistrem
Le groupe Taotian accélère sa restructuration axée sur l'IA et offre des quotas de jetons gratuits à ses stagiaires Le groupe TaoTian a récemment lancé le « Plan de productivité IA », conçu pour accélérer l'intégration de la technologie IA dans les opérations de commerce électronique et les processus de R&D grâce à
Glean vise les infrastructures d'IA d'entreprise dans une course à l'acquisition de parts de marché La course à la domination du marché de l'IA d'entreprise s'accélère. Microsoft intègre Copilot à Office, Google intègre Gemini à Workspace, tandis qu'OpenAI et Anthropic commercialisent leurs produits
Un modèle linguistique tibétain remporte un franc succès au Salon des sciences et des technologies de Pékin Lors de la 28e édition du Salon international des sciences, des technologies et de l'industrie de Pékin, en Chine, un modèle linguistique de grande envergure capable de « comprendre » le tibétain et d
Anthropic fusionne avec Google dans le cadre d'un pari de 20 milliards de dollars, la concurrence dans le domaine de l'informatique appliquée à l'IA s'intensifie Alors que la concurrence dans le domaine de l'intelligence artificielle s'intensifie, des start-ups de premier plan telles qu'Anthropic ont pris une décision majeure. Selon certaines sources, l'entrep
Comparaison du modèle
Démarrer la comparaison
OR