Nom du modèle | FOURNISSEUR | Paramètres |
SCORE |
date de sortie |
COMPARER |
---|---|---|---|---|---|
DeepSeek-V3 surpasse les autres modèles open-source tels que Qwen2.5-72B et Llama-3.1-405B dans plusieurs évaluations et égale les performances des modèles propriétaires de premier plan comme GPT-4 et Claude-3.5-Sonnet.
|
DeepSeek | 671B | 5.4 | 24 mars 2025 | |
o4-mini en mode élevéburgois, qui a un temps de réponse plus long et une capacité de raisonnement plus forte.
|
OpenAI | N/A | 6.2 | 16 avril 2025 | |
Le dernier modèle MoE open-source publié par Tencent.
|
Tencent | 80B | 5.1 | 27 juin 2025 | |
Le dernier modèle lancé par Moonshot AI, doté de capacités de codage améliorées et de performances supérieures dans les tâches d'agent général, construit sur une architecture MoE.
|
Moonshot | 1000B | 5.5 | 11 juillet 2025 | |
Le modèle de langage à grande échelle Bailing est un LLM à usage général qui a complété le processus de dépôt d'IA générative, entraîné sur des trillions de jetons. Il adopte le numéro de version Bailing-Pro-20250225.
|
Ant Group | N/A | 4.4 | 25 février 2025 | |
Le modèle d'inférence Spark X1, publié par iFlytek, sur la base de performances de pointe dans les tâches mathématiques nationales, évalue ses performances dans des tâches générales telles que l'inférence, la génération de texte et la compréhension du langage par rapport à la série o d'OpenAI et DeepSeek R1.
|
iFLYTEK | N/A | 5.4 | 20 juillet 2025 | |
MiniMax-Text-01 est un modèle linguistique puissant avec un total de 456 milliards de paramètres, dont 45,9 milliards sont activés par jeton. Pour mieux exploiter les capacités de contexte long du modèle, MiniMax-Text-01 adopte une architecture hybride qui combine l'Attention Lightning, l'Attention Softmax et le Mixture-of-Experts (MoE).
|
MiniMax | 456B | 3.8 | 15 janvier 2025 | |
La nouvelle série de modèles de raisonnement GLM-4.5 publiée par GLM.
|
Zhipu AI | 110B | 5.6 | 29 juillet 2025 | |
Le premier modèle de raisonnement à attention hybride à grande échelle et à poids ouvert au monde, publié par Minimax.
|
MiniMax | 456B | 5.5 | 17 juin 2025 | |
Qwen3 est la dernière génération de grands modèles de langage de la série Qwen, offrant une suite complète de modèles denses et de modèles à mélange d'experts (MoE).
|
Alibaba | 235B | 5.7 | 22 juillet 2025 |