Lista de modelos AL

Desliza hacia la izquierda y la derecha para ver más

Nombre del modelo	PROVEEDOR	Parámetros	PUNTAJE	Fecha de lanzamiento
DeepSeek-V3-0324 DeepSeek-V3 supera a otros modelos de código abierto como Qwen2.5-72B y Llama-3.1-405B en múltiples evaluaciones y iguala el rendimiento de modelos de código cerrado de primer nivel como GPT-4 y Claude-3.5-Sonnet.	DeepSeek	671B	5.4	24 de marzo de 2025
o4-mini-high-2025-04-16 o4-mini en modo alto, que tiene un tiempo de respuesta más largo y una mayor capacidad de razonamiento.	OpenAI	N/A	6.2	16 de abril de 2025
Hunyuan-A13B-Instruct El último modelo MoE de código abierto lanzado por Tencent	Tencent	80B	5.1	27 de junio de 2025
Kimi-K2-Instruct El último modelo lanzado por Moonshot AI, con capacidades de codificación mejoradas y un rendimiento superior en tareas generales de agentes, construido sobre una arquitectura MoE.	Moonshot	1000B	5.5	11 de julio de 2025
Bailing-Pro-20250225 El Modelo de Lenguaje Grande Bailing es un LLM de propósito general que ha completado el proceso de registro de IA generativa, entrenado con billones de tokens. Adopta el número de versión Bailing-Pro-20250225.	Ant Group	N/A	4.4	25 de febrero de 2025
iFlytek-Spark-X1-0720 El modelo de inferencia Spark X1 lanzado por iFlytek, sobre la base de liderar las tareas matemáticas nacionales, compara el rendimiento de tareas generales como inferencia, generación de texto y comprensión del lenguaje con la serie o de OpenAI y DeepSeek R1.	iFLYTEK	N/A	5.4	20 de julio de 2025
MiniMax-Text-01 MiniMax-Text-01 es un modelo de lenguaje potente con un total de 456 mil millones de parámetros, de los cuales 45.9 mil millones se activan por token. Para aprovechar mejor las capacidades de contexto largo del modelo, MiniMax-Text-01 adopta una arquitectura híbrida que combina Lightning Attention, Softmax Attention y Mixture-of-Experts (MoE).	MiniMax	456B	3.8	15 de enero de 2025
GLM-4.5-Air La nueva serie de modelos de razonamiento GLM-4.5 lanzada por GLM.	Zhipu AI	110B	5.6	29 de julio de 2025
MiniMax-M1-80k El primer modelo de razonamiento de atención híbrida a gran escala y de peso abierto del mundo, lanzado por Minimax.	MiniMax	456B	5.5	17 de junio de 2025
Qwen3-235B-A22B-Instruct-2507 Qwen3 es la última generación de modelos de lenguaje grandes de la serie Qwen, que ofrece una colección completa de modelos densos y de mezcla de expertos (MoE).	Alibaba	235B	5.7	22 de julio de 2025

Cargar más