opción
Hogar
Lista de modelos AL
DBRX-Instruct
Cantidad de parámetros del modelo
132B
Cantidad de parámetros del modelo
Organización afiliada
DataBricks
Organización afiliada
Código abierto
Tipo de licencia
Tiempo de lanzamiento
26 de marzo de 2024
Tiempo de lanzamiento
Introducción al modelo
DBRX-Instruct es un modelo MoE entrenado desde cero por DataBricks, utilizando un esquema de selección de 16 expertos eligiendo 4, con una cantidad de parámetros activos de 36B. Se preentrenó en 12T tokens, con soporte para un contexto de 32K.
Desliza hacia la izquierda y la derecha para ver más
Capacidad de comprensión del lenguaje Capacidad de comprensión del lenguaje
Capacidad de comprensión del lenguaje
A menudo hace juicios mal semánticos, lo que lleva a obvias desconexiones lógicas en las respuestas.
2.5
Alcance de cobertura de conocimiento Alcance de cobertura de conocimiento
Alcance de cobertura de conocimiento
Tiene puntos ciegos de conocimiento significativo, a menudo que muestran errores objetivos y repitiendo información obsoleta.
6.6
Capacidad de razonamiento Capacidad de razonamiento
Capacidad de razonamiento
Incapaz de mantener cadenas de razonamiento coherentes, a menudo causando causalidad invertida o errores de cálculo.
2.0
Modelo relacionado
DBRX-Instruct DBRX-Instruct es un modelo MoE entrenado desde cero por DataBricks, utilizando un esquema de selección de 16 expertos eligiendo 4, con un recuento de parámetros activos de 36B. Se preentrenó en 12T tokens, con un contexto de 32K.
Qwen2.5-7B-Instruct Así como Qwen2, los modelos de lenguaje Qwen2.5 admiten hasta 128K tokens y pueden generar hasta 8K tokens. También mantienen el soporte multilingüe para más de 29 idiomas, incluidos chino, inglés, francés, español, portugués, alemán, italiano, ruso, japonés, coreano, vietnamita, tailandés, árabe y más.
Hunyuan-T1-20250822 El modelo de razonamiento profundo desarrollado independientemente por Tencent adopta el número de versión hunyuan-t1-20250822.
Spark-X1 El modelo de inferencia Spark X1 lanzado por iFlytek, además de liderar tareas matematicas nacionales, evalua el rendimiento de tareas generales como inferencia, generacion de texto e inteligencia linguistica frente al OpenAI o1 y el DeepSeek R1.
Doubao-Seed-1.6-thinking-250715 La última versión del modelo de la serie Seed lanzado por ByteDance, que soporta el modo de pensamiento.
Documentos relevantes
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf
Google presenta los cuadernos Gemini, que combinan NotebookLM con una base de conocimientos personal Google ha lanzado recientemente la función «Notebooks» para Gemini, diseñada para ayudar a los usuarios a gestionar proyectos complejos mediante la creación de una base de conocimientos personalizada.
Luma AI presenta el modelo autorregresivo Uni-1, capaz de generar texto y píxeles al mismo tiempo Luma Labs lanzó el 23 de marzo su modelo de generación de imágenes Uni-1, el primer modelo de la empresa disponible para el público general y basado en la arquitectura Unified Intelligence. Ya está di
Xinzhou Wu, de NVIDIA: «Ha llegado el momento ChatGPT de la conducción autónoma; la producción en masa del nivel 4 ya no es un sueño» En el ámbito de la IA física, en rápida evolución, la conducción autónoma suele considerarse el primer gran reto que hay que superar. Recientemente, Wu Xinzhou, vicepresidente de NVIDIA, expuso la amb
Anthropic sube discretamente los precios del código de Claude; las tarifas diarias para desarrolladores se duplican Las presiones sobre los costes en la programación de IA son cada vez más evidentes. Anthropic, una empresa líder en IA, ha ajustado recientemente los precios de su herramienta de programación de IA, C
Comparación de modelos
Comience la comparación
OR