Nombre del modelo | PROVEEDOR | Parámetros |
PUNTAJE |
Fecha de lanzamiento |
COMPARAR |
---|---|---|---|---|---|
DeepSeek-V3 supera a otros modelos de código abierto como Qwen2.5-72B y Llama-3.1-405B en múltiples evaluaciones y iguala el rendimiento de modelos de código cerrado de primer nivel como GPT-4 y Claude-3.5-Sonnet.
|
DeepSeek | 671B | 5.4 | 24 de marzo de 2025 | |
o4-mini en modo alto, que tiene un tiempo de respuesta más largo y una mayor capacidad de razonamiento.
|
OpenAI | N/A | 6.2 | 16 de abril de 2025 | |
El último modelo MoE de código abierto lanzado por Tencent
|
Tencent | 80B | 5.1 | 27 de junio de 2025 | |
El último modelo lanzado por Moonshot AI, con capacidades de codificación mejoradas y un rendimiento superior en tareas generales de agentes, construido sobre una arquitectura MoE.
|
Moonshot | 1000B | 5.5 | 11 de julio de 2025 | |
El Modelo de Lenguaje Grande Bailing es un LLM de propósito general que ha completado el proceso de registro de IA generativa, entrenado con billones de tokens. Adopta el número de versión Bailing-Pro-20250225.
|
Ant Group | N/A | 4.4 | 25 de febrero de 2025 | |
El modelo de inferencia Spark X1 lanzado por iFlytek, sobre la base de liderar las tareas matemáticas nacionales, compara el rendimiento de tareas generales como inferencia, generación de texto y comprensión del lenguaje con la serie o de OpenAI y DeepSeek R1.
|
iFLYTEK | N/A | 5.4 | 20 de julio de 2025 | |
MiniMax-Text-01 es un modelo de lenguaje potente con un total de 456 mil millones de parámetros, de los cuales 45.9 mil millones se activan por token. Para aprovechar mejor las capacidades de contexto largo del modelo, MiniMax-Text-01 adopta una arquitectura híbrida que combina Lightning Attention, Softmax Attention y Mixture-of-Experts (MoE).
|
MiniMax | 456B | 3.8 | 15 de enero de 2025 | |
La nueva serie de modelos de razonamiento GLM-4.5 lanzada por GLM.
|
Zhipu AI | 110B | 5.6 | 29 de julio de 2025 | |
El primer modelo de razonamiento de atención híbrida a gran escala y de peso abierto del mundo, lanzado por Minimax.
|
MiniMax | 456B | 5.5 | 17 de junio de 2025 | |
Qwen3 es la última generación de modelos de lenguaje grandes de la serie Qwen, que ofrece una colección completa de modelos densos y de mezcla de expertos (MoE).
|
Alibaba | 235B | 5.7 | 22 de julio de 2025 |