Liste des modèles Al

Faites glisser vers la gauche et la droite pour voir plus

Nom du modèle	FOURNISSEUR	Paramètres	SCORE	date de sortie
DeepSeek-V3-0324 DeepSeek-V3 surpasse les autres modèles open-source tels que Qwen2.5-72B et Llama-3.1-405B dans plusieurs évaluations et égale les performances des modèles propriétaires de premier plan comme GPT-4 et Claude-3.5-Sonnet.	DeepSeek	671B	5.4	24 mars 2025
o4-mini-high-2025-04-16 o4-mini en mode élevéburgois, qui a un temps de réponse plus long et une capacité de raisonnement plus forte.	OpenAI	N/A	6.2	16 avril 2025
Hunyuan-A13B-Instruct Le dernier modèle MoE open-source publié par Tencent.	Tencent	80B	5.1	27 juin 2025
Kimi-K2-Instruct Le dernier modèle lancé par Moonshot AI, doté de capacités de codage améliorées et de performances supérieures dans les tâches d'agent général, construit sur une architecture MoE.	Moonshot	1000B	5.5	11 juillet 2025
Bailing-Pro-20250225 Le modèle de langage à grande échelle Bailing est un LLM à usage général qui a complété le processus de dépôt d'IA générative, entraîné sur des trillions de jetons. Il adopte le numéro de version Bailing-Pro-20250225.	Ant Group	N/A	4.4	25 février 2025
iFlytek-Spark-X1-0720 Le modèle d'inférence Spark X1, publié par iFlytek, sur la base de performances de pointe dans les tâches mathématiques nationales, évalue ses performances dans des tâches générales telles que l'inférence, la génération de texte et la compréhension du langage par rapport à la série o d'OpenAI et DeepSeek R1.	iFLYTEK	N/A	5.4	20 juillet 2025
MiniMax-Text-01 MiniMax-Text-01 est un modèle linguistique puissant avec un total de 456 milliards de paramètres, dont 45,9 milliards sont activés par jeton. Pour mieux exploiter les capacités de contexte long du modèle, MiniMax-Text-01 adopte une architecture hybride qui combine l'Attention Lightning, l'Attention Softmax et le Mixture-of-Experts (MoE).	MiniMax	456B	3.8	15 janvier 2025
GLM-4.5-Air La nouvelle série de modèles de raisonnement GLM-4.5 publiée par GLM.	Zhipu AI	110B	5.6	29 juillet 2025
MiniMax-M1-80k Le premier modèle de raisonnement à attention hybride à grande échelle et à poids ouvert au monde, publié par Minimax.	MiniMax	456B	5.5	17 juin 2025
Qwen3-235B-A22B-Instruct-2507 Qwen3 est la dernière génération de grands modèles de langage de la série Qwen, offrant une suite complète de modèles denses et de modèles à mélange d'experts (MoE).	Alibaba	235B	5.7	22 juillet 2025

Chargez plus