Name: DBRX-Instruct
Rating: 1 (57 reviews)
Author: DataBricks

Maison

Liste des modèles Al

DBRX-Instruct

Ajouter la comparaison

132B

Quantité de paramètre de modèle

DataBricks

Organisation affiliée

Source ouverte

Type de licence

26 mars 2024

Temps de libération

Site officiel

Documentation du modèle

Rapport technique

Introduction du modèle

DBRX-Instruct est un modèle MoE entraîné depuis zéro par DataBricks, utilisant un mécanisme de sélection de 16 experts choisissant 4, avec un nombre de paramètres actifs de 36B. Il est pré-entraîné sur 12T de tokens, avec une prise en charge du contexte de 32K.

Score complet Dialogue du langage Réserve de connaissances Association de raisonnement Calcul mathématique Écriture de code Commande suivante

Faites glisser vers la gauche et la droite pour voir plus

Capacité de compréhension du langage

Fait souvent des erreurs de jugement sémantique, conduisant à des déconnexions logiques évidentes dans les réponses.

3.8

Portée de la couverture des connaissances

A des angles morts de connaissances importantes, montrant souvent des erreurs factuelles et répétant des informations obsolètes.

5.9

Capacité de raisonnement

Incapable de maintenir des chaînes de raisonnement cohérentes, provoquant souvent une causalité inversée ou des erreurs de calcul.

2.6

Comparaison du modèle

DBRX-Instruct vs Qwen2.5-7B-Instruct Comme Qwen2, les modèles de langue Qwen2.5 prennent en charge jusqu'à 128K tokens et peuvent générer jusqu'à 8K tokens. Ils maintiennent également une prise en charge multilingue pour plus de 29 langues, y compris le chinois, l'anglais, le français, l'espagnol, le portugais, l'allemand, l'italien, le russe, le japonais, le coréen, le vietnamien, le thaï, l'arabe et bien d'autres.

DBRX-Instruct vs Hunyuan-T1-20250822 Le modèle de raisonnement profond développé indépendamment par Tencent porte le numéro de version hunyuan-t1-20250822.

DBRX-Instruct vs Spark-X1 Le modèle d'inférence Spark X1 publié par iFlytek, sur la base de tâches mathématiques nationales de premier plan, compare les performances de tâches générales telles que l'inférence, la génération de texte et la compréhension du langage avec OpenAI o1 et DeepSeek R1.

DBRX-Instruct vs Doubao-Seed-1.6-thinking-250715 La dernière version du modèle de la série seed lancé par ByteDance, qui prend en charge le mode de réflexion.

DBRX-Instruct vs Doubao-Seed-1.6-251015 (Thinking) Le modèle de raisonnement profond publié par ByteDance, qui prend en charge la commutation manuelle du raisonnement profond, et ses performances sont considérablement améliorées par rapport à doubao-1.5.

Modèle connexe

DBRX-Instruct DBRX-Instruct est un modèle MoE entraîné depuis zéro par DataBricks, utilisant un mécanisme de sélection de 16 experts choisissant 4, avec un compteur de paramètres actifs de 36B. Il est pré-entraîné sur 12T de tokens, avec un contexte de 32K.

Qwen2.5-7B-Instruct Comme Qwen2, les modèles de langue Qwen2.5 prennent en charge jusqu'à 128K tokens et peuvent générer jusqu'à 8K tokens. Ils maintiennent également une prise en charge multilingue pour plus de 29 langues, y compris le chinois, l'anglais, le français, l'espagnol, le portugais, l'allemand, l'italien, le russe, le japonais, le coréen, le vietnamien, le thaï, l'arabe et bien d'autres.

Hunyuan-T1-20250822 Le modèle de raisonnement profond développé indépendamment par Tencent porte le numéro de version hunyuan-t1-20250822.

Spark-X1 Le modèle d'inférence Spark X1 publié par iFlytek, sur la base de tâches mathématiques nationales de premier plan, compare les performances de tâches générales telles que l'inférence, la génération de texte et la compréhension du langage avec OpenAI o1 et DeepSeek R1.

Doubao-Seed-1.6-thinking-250715 La dernière version du modèle de la série seed lancé par ByteDance, qui prend en charge le mode de réflexion.

Documents pertinents

Meta AI répond désormais aux messages des acheteurs sur Facebook Marketplace Facebook Marketplace lance de nouvelles fonctionnalités basées sur l'IA de Meta, notamment des réponses automatiques aux demandes des acheteurs, a annoncé jeudi l'entreprise. La plateforme u

OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra

Google dévoile les carnets Gemini, qui associent NotebookLM à une base de connaissances personnelle Google a récemment lancé une fonctionnalité « Notebooks » pour Gemini, conçue pour aider les utilisateurs à gérer des projets complexes en créant une base de connaissances personnalisée. Cette mise à

Luma AI dévoile Uni-1, un modèle autorégressif capable de générer simultanément du texte et des pixels Luma Labs a lancé le 23 mars son modèle de génération d'images Uni-1, qui constitue le premier modèle de l'entreprise accessible au public et basé sur l'architecture Unified Intelligenc

Xinzhou Wu, de NVIDIA : « Le moment ChatGPT de la conduite autonome est arrivé, la production en série de véhicules de niveau 4 n'est plus un rêve » Dans le domaine en pleine évolution de l'IA physique, la conduite autonome est souvent considérée comme le premier défi majeur à relever. Récemment, Wu Xinzhou, vice-président de NVIDIA, a présen

Comparaison du modèle

Démarrer la comparaison