opción
Hogar
Lista de modelos AL
DBRX-Instruct
Cantidad de parámetros del modelo
132B
Cantidad de parámetros del modelo
Organización afiliada
DataBricks
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
26 de marzo de 2024
Tiempo de lanzamiento
Introducción al modelo
DBRX-Instruct es un modelo MoE entrenado desde cero por DataBricks, utilizando un esquema de selección de 16 expertos eligiendo 4, con un recuento de parámetros activos de 36B. Se preentrenó en 12T tokens, con un contexto de 32K.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
3.8
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Tiene puntos ciegos de conocimiento significativo, a menudo que muestran errores objetivos y repitiendo información obsoleta.
5.9
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
2.6
Modelo relacionado
DBRX-Instruct DBRX-Instruct es un modelo MoE entrenado desde cero por DataBricks, utilizando un esquema de selección de 16 expertos eligiendo 4, con una cantidad de parámetros activos de 36B. Se preentrenó en 12T tokens, con soporte para un contexto de 32K.
Qwen2.5-7B-Instruct Así como Qwen2, los modelos de lenguaje Qwen2.5 admiten hasta 128K tokens y pueden generar hasta 8K tokens. También mantienen el soporte multilingüe para más de 29 idiomas, incluidos chino, inglés, francés, español, portugués, alemán, italiano, ruso, japonés, coreano, vietnamita, tailandés, árabe y más.
Hunyuan-T1-20250822 El modelo de razonamiento profundo desarrollado independientemente por Tencent adopta el número de versión hunyuan-t1-20250822.
Spark-X1 El modelo de inferencia Spark X1 lanzado por iFlytek, además de liderar tareas matematicas nacionales, evalua el rendimiento de tareas generales como inferencia, generacion de texto e inteligencia linguistica frente al OpenAI o1 y el DeepSeek R1.
Doubao-Seed-1.6-251015 (Thinking) El modelo de razonamiento profundo lanzado por ByteDance, que admite el cambio manual de razonamiento profundo, y su rendimiento mejora significativamente en comparación con doubao-1.5.
Documentos relevantes
China Telecom invierte en Mianbi Intelligence y aumenta su capital a 713 000 yuanes para modelos de lenguaje a gran escala (LLM) e infraestructura de datos El «equipo nacional» y la figura destacada de la Universidad de Tsinghua en el ámbito de los modelos a gran escala están profundizando en su alineación estratégica. El 1 de marzo de 2026, según los úl
El Grupo Taotian acelera su reestructuración centrada en la IA y concede a los becarios cuotas de tokens gratuitas El Grupo TaoTian ha presentado recientemente el «Plan de Productividad con IA», diseñado para acelerar la integración de la tecnología de IA en las operaciones de comercio electrónico y los flujos de
Glean se centra en la infraestructura de IA empresarial en su carrera por el mercado La carrera por dominar la IA empresarial se está acelerando. Microsoft está incorporando Copilot a Office, Google está integrando Gemini en Workspace, y tanto OpenAI como Anthropic están vendiendo dir
El modelo lingüístico tibetano cosecha elogios en la Feria de Ciencia y Tecnología de Pekín En la 28.ª Exposición Internacional de Ciencia, Tecnología e Industria de Pekín (China), un modelo de lenguaje a gran escala capaz de «comprender» el tibetano y generar contenidos utilizando un razona
Anthropic se fusiona con Google en una apuesta de 20 000 millones de dólares; se intensifica la competencia en el ámbito de la computación con IA A medida que se intensifica la competencia en el ámbito de la inteligencia artificial, las principales empresas emergentes del sector, como Anthropic, han dado un paso decisivo. Según algunas fuentes,
Comparación de modelos
Comience la comparación
OR