option
Quantité de paramètre de modèle
132B
Quantité de paramètre de modèle
Organisation affiliée
DataBricks
Organisation affiliée
Source ouverte
Type de licence
Temps de libération
25 mars 2024
Temps de libération
Introduction du modèle
DBRX-Instruct est un modèle MoE entraîné depuis zéro par DataBricks, utilisant un mécanisme de sélection de 16 experts choisissant 4, avec un compteur de paramètres actifs de 36B. Il est pré-entraîné sur 12T de tokens, avec un contexte de 32K.
Capacité de compréhension du langage Capacité de compréhension du langage
Capacité de compréhension du langage
Fait souvent des erreurs de jugement sémantique, conduisant à des déconnexions logiques évidentes dans les réponses.
2.5
Portée de la couverture des connaissances Portée de la couverture des connaissances
Portée de la couverture des connaissances
A des angles morts de connaissances importantes, montrant souvent des erreurs factuelles et répétant des informations obsolètes.
6.6
Capacité de raisonnement Capacité de raisonnement
Capacité de raisonnement
Incapable de maintenir des chaînes de raisonnement cohérentes, provoquant souvent une causalité inversée ou des erreurs de calcul.
2.0
Modèle connexe
DBRX-Instruct DBRX-Instruct est un modèle MoE entraîné depuis zéro par DataBricks, utilisant un mécanisme de sélection de 16 experts choisissant 4, avec un nombre de paramètres actifs de 36B. Il est pré-entraîné sur 12T de tokens, avec une prise en charge du contexte de 32K.
Qwen2.5-7B-Instruct Comme Qwen2, les modèles de langue Qwen2.5 prennent en charge jusqu'à 128K tokens et peuvent générer jusqu'à 8K tokens. Ils maintiennent également une prise en charge multilingue pour plus de 29 langues, y compris le chinois, l'anglais, le français, l'espagnol, le portugais, l'allemand, l'italien, le russe, le japonais, le coréen, le vietnamien, le thaï, l'arabe et bien d'autres.
Doubao-1.5-thinking-pro-250415 Le nouveau modèle de réflexion profonde Doubao-1.5 se distingue dans des domaines professionnels tels que les mathématiques, la programmation, la raisonnement scientifique, ainsi que dans des tâches générales comme l'écriture créative. Il a atteint ou est proche du niveau supérieur de l'industrie sur plusieurs benchmarks autorisés tels que AIME 2024, Codeforces et GPQA.
Step-1-8K Step-1-8K est un modèle API produit par Step Star, le numéro de version du modèle est step-1-8k.
GPT-4o-mini-20240718 GPT-4o-mini est un modèle API créé par OpenAI, avec le numéro de version spécifique étant gpt-4o-mini-2024-07-18.
Documents pertinents
Gemini Code Assist améliore le codage IA avec des fonctionnalités agentes Gemini Code Assist, l'assistant de codage propulsé par l'IA de Google, déploie de nouvelles fonctionnalités "agentiques" en mode prévisualisation. Lors de la récente conférence Clo
Microsoft open-source un éditeur de texte CLI à Build Microsoft mise tout sur l'open source à Build 2025Lors de la conférence Build 2025, Microsoft a opéré un virage majeur vers l'open source en dévoilant plusieurs outils clés, dont u
OpenAI améliore le modèle d'IA derrière son Operator Agent OpenAI fait passer Operator au niveau supérieur OpenAI donne un sérieux coup de pouce à son agent autonome Operator. Les prochaines mises à jour permettront à Operator de s'appuye
Le fonds futur de l'IA de Google pourrait devoir avancer prudemment L’Initiative d’Investissement en IA de Google : Un Changement Stratégique Face à une Surveillance RéglementaireL’annonce récente par Google de son fonds AI Futures marque un mouvem
Générateur de vignettes AI YouTube: Boostez vos vues vidéo La puissance de l'IA dans la création de vignettes YouTube dans le paysage numérique d'aujourd'hui, une vignette YouTube captivante est cruciale pour attirer l'attention des téléspectateurs. Avec des millions de vidéos en concurrence pour les clics, une miniature frappante peut faire toute la différence. Les générateurs de vignettes AI YouTube ont émergé comme un GAM
Comparaison du modèle
Démarrer la comparaison
Retour en haut
OR