Name: DBRX-Instruct
Rating: 1 (10 reviews)
Author: DataBricks

Hogar

Lista de modelos AL

DBRX-Instruct

Agregar comparación

132B

Cantidad de parámetros del modelo

DataBricks

Organización afiliada

Código abierto

Tipo de licencia

26 de marzo de 2024

Tiempo de lanzamiento

Sitio web oficial

Documentación modelo

Informe técnico

Introducción al modelo

DBRX-Instruct es un modelo MoE entrenado desde cero por DataBricks, utilizando un esquema de selección de 16 expertos eligiendo 4, con un recuento de parámetros activos de 36B. Se preentrenó en 12T tokens, con un contexto de 32K.

Puntaje integral Diálogo del idioma Reserva de conocimiento Asociación de razonamiento Cálculo matemático Redacción de código Comando siguiente

Desliza hacia la izquierda y la derecha para ver más

Capacidad de comprensión del lenguaje

A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.

3.8

Alcance de cobertura de conocimiento

Tiene puntos ciegos de conocimiento significativo, a menudo que muestran errores objetivos y repitiendo información obsoleta.

5.9

Capacidad de razonamiento

Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.

2.6

Comparación de modelos

DBRX-Instruct vs Qwen2.5-7B-Instruct Así como Qwen2, los modelos de lenguaje Qwen2.5 admiten hasta 128K tokens y pueden generar hasta 8K tokens. También mantienen el soporte multilingüe para más de 29 idiomas, incluidos chino, inglés, francés, español, portugués, alemán, italiano, ruso, japonés, coreano, vietnamita, tailandés, árabe y más.

DBRX-Instruct vs GPT-4o-mini-20240718 GPT-4o-mini es un modelo de API producido por OpenAI, con el número de versión específico siendo gpt-4o-mini-2024-07-18.

DBRX-Instruct vs Gemini-2.5-Pro-Preview-05-06 Gemini 2.5 Pro es un modelo lanzado por el equipo de investigación en inteligencia artificial Google DeepMind, utilizando el número de versión Gemini-2.5-Pro-Preview-05-06.

DBRX-Instruct vs DeepSeek-V2-Chat-0628 DeepSeek-V2 es un modelo de lenguaje de Mixture-of-Experts (MoE) potente, caracterizado por un entrenamiento económico y una inferencia eficiente. Cuenta con 236 mil millones de parámetros en total, de los cuales 21 mil millones están activos para cada token. En comparación con DeepSeek 67B, DeepSeek-V2 ofrece un mejor rendimiento, reduce en un 42,5% los costos de entrenamiento, disminuye el almacenamiento en caché KV en un 93,3% y mejora la capacidad máxima de generación hasta 5,76 veces.

Modelo relacionado

DBRX-Instruct DBRX-Instruct es un modelo MoE entrenado desde cero por DataBricks, utilizando un esquema de selección de 16 expertos eligiendo 4, con una cantidad de parámetros activos de 36B. Se preentrenó en 12T tokens, con soporte para un contexto de 32K.

Qwen2.5-7B-Instruct Así como Qwen2, los modelos de lenguaje Qwen2.5 admiten hasta 128K tokens y pueden generar hasta 8K tokens. También mantienen el soporte multilingüe para más de 29 idiomas, incluidos chino, inglés, francés, español, portugués, alemán, italiano, ruso, japonés, coreano, vietnamita, tailandés, árabe y más.

GPT-4o-mini-20240718 GPT-4o-mini es un modelo de API producido por OpenAI, con el número de versión específico siendo gpt-4o-mini-2024-07-18.

Gemini-2.5-Pro-Preview-05-06 Gemini 2.5 Pro es un modelo lanzado por el equipo de investigación en inteligencia artificial Google DeepMind, utilizando el número de versión Gemini-2.5-Pro-Preview-05-06.

Documentos relevantes

Encontrar la fuerza a través de la fe: Explorando su poder pacífico En medio del caos y las presiones de la vida moderna, resulta esencial descubrir la tranquilidad interior y una resistencia duradera. La fe se mantiene firme como un pilar para innumerables personas,

Impulsar la construcción de su lista de AI con contenido PLR: La Guía Definitiva Crear una lista de correo electrónico de alta calidad es la base de cualquier estrategia de marketing digital de éxito. Las herramientas modernas de IA combinadas con el contenido de Derechos de Marca

La revolución de la IA en la publicidad: Multiplique por 10 la creatividad en 2025 El panorama de la publicidad digital sigue evolucionando rápidamente, por lo que la innovación es imprescindible para el éxito competitivo. A medida que nos acercamos a 2025, la fusión de la inteligen

Los sistemas de contratación basados en IA revelan los sesgos ocultos que influyen en las decisiones de contratación Los sesgos ocultos en la contratación de IA: Cómo abordar la discriminación sistémica en los algoritmos de contrataciónIntroducciónLas herramientas de contratación impulsadas por IA prometen transform

Los datos de Ramp revelan un estancamiento en la adopción de la IA por parte de las empresas La adopción de la IA por parte de las empresas se estancaAunque al principio las empresas se apresuraron a implantar soluciones de inteligencia artificial, el entusiasmo parece estabilizarse a medida

Comparación de modelos

Comience la comparación