opción

Lista de modelos AL

Desliza hacia la izquierda y la derecha para ver más
Nombre del modelo PROVEEDOR Parámetros PUNTAJE
Fecha de lanzamiento
COMPARAR
DeepSeek-V3 supera a otros modelos de código abierto como Qwen2.5-72B y Llama-3.1-405B en múltiples evaluaciones y iguala el rendimiento de modelos de código cerrado de primer nivel como GPT-4 y Claude-3.5-Sonnet.
DeepSeek 671B 5.4 24 de marzo de 2025
o4-mini en modo alto, que tiene un tiempo de respuesta más largo y una mayor capacidad de razonamiento.
OpenAI N/A 6.2 16 de abril de 2025
El último modelo MoE de código abierto lanzado por Tencent
Tencent 80B 5.1 27 de junio de 2025
El último modelo lanzado por Moonshot AI, con capacidades de codificación mejoradas y un rendimiento superior en tareas generales de agentes, construido sobre una arquitectura MoE.
Moonshot 1000B 5.5 11 de julio de 2025
El Modelo de Lenguaje Grande Bailing es un LLM de propósito general que ha completado el proceso de registro de IA generativa, entrenado con billones de tokens. Adopta el número de versión Bailing-Pro-20250225.
Ant Group N/A 4.4 25 de febrero de 2025
El modelo de inferencia Spark X1 lanzado por iFlytek, sobre la base de liderar las tareas matemáticas nacionales, compara el rendimiento de tareas generales como inferencia, generación de texto y comprensión del lenguaje con la serie o de OpenAI y DeepSeek R1.
iFLYTEK N/A 5.4 20 de julio de 2025
MiniMax-Text-01 es un modelo de lenguaje potente con un total de 456 mil millones de parámetros, de los cuales 45.9 mil millones se activan por token. Para aprovechar mejor las capacidades de contexto largo del modelo, MiniMax-Text-01 adopta una arquitectura híbrida que combina Lightning Attention, Softmax Attention y Mixture-of-Experts (MoE).
MiniMax 456B 3.8 15 de enero de 2025
La nueva serie de modelos de razonamiento GLM-4.5 lanzada por GLM.
Zhipu AI 110B 5.6 29 de julio de 2025
El primer modelo de razonamiento de atención híbrida a gran escala y de peso abierto del mundo, lanzado por Minimax.
MiniMax 456B 5.5 17 de junio de 2025
Qwen3 es la última generación de modelos de lenguaje grandes de la serie Qwen, que ofrece una colección completa de modelos densos y de mezcla de expertos (MoE).
Alibaba 235B 5.7 22 de julio de 2025
Volver arriba
OR