option
Quantité de paramètre de modèle
N/A
Quantité de paramètre de modèle
Organisation affiliée
Alibaba
Organisation affiliée
Source fermée
Type de licence
Temps de libération
28 janvier 2025
Temps de libération

Introduction du modèle
Qwen 2.5 Max est un modèle MoE (Mixture-of-Experts) de grande taille entraîné avec plus de 20 billions de tokens de données pré-entraînement et un schéma de post-entraînement minutieusement conçu.
Faites glisser vers la gauche et la droite pour voir plus
Capacité de compréhension du langage Capacité de compréhension du langage
Capacité de compréhension du langage
Capable de comprendre des contextes complexes et de générer des phrases logiquement cohérentes, bien que parfois hors du contrôle de la tonalité.
7.5
Portée de la couverture des connaissances Portée de la couverture des connaissances
Portée de la couverture des connaissances
Possède une connaissance fondamentale des disciplines traditionnelles, mais a une couverture limitée des champs interdisciplinaires de pointe.
8.8
Capacité de raisonnement Capacité de raisonnement
Capacité de raisonnement
Incapable de maintenir des chaînes de raisonnement cohérentes, provoquant souvent une causalité inversée ou des erreurs de calcul.
6.8
Comparaison du modèle
Modèle connexe
Qwen3-235B-A22B-Instruct-2507 Qwen3 est la dernière génération de grands modèles de langage de la série Qwen, offrant une suite complète de modèles denses et de modèles à mélange d'experts (MoE).
Qwen3-235B-A22B-Thinking-2507 Qwen3 est la dernière génération de grands modèles de langage de la série Qwen, offrant une suite complète de modèles denses et de modèles à mélange d'experts (MoE).
Qwen2.5-7B-Instruct Comme Qwen2, les modèles de langue Qwen2.5 prennent en charge jusqu'à 128K tokens et peuvent générer jusqu'à 8K tokens. Ils maintiennent également une prise en charge multilingue pour plus de 29 langues, y compris le chinois, l'anglais, le français, l'espagnol, le portugais, l'allemand, l'italien, le russe, le japonais, le coréen, le vietnamien, le thaï, l'arabe et bien d'autres.
Qwen3-32B (Thinking) Qwen3 est la dernière génération de modèles de langue de grande taille dans la série Qwen, offrant un ensemble complet de modèles denses et experts mixtes (MoE).
Qwen1.5-72B-Chat Qwen1.5 est la version bêta de Qwen2, conservant son architecture de modèle de transformation de type decoder-only avec l'activation SwiGLU, RoPE et les mécanismes d'attention multi-têtes. Elle propose neuf tailles de modèles et possède des capacités améliorées en matière de multilinguisme et de modèles de conversation, prenant en charge une longueur de contexte de 32 768 tokens. Tous les modèles disposent de prompts système pour le jeu de rôles, et le code supporte une implémentation native dans transformers.
Documents pertinents
Google présente des outils alimentés par l'IA pour Gmail, Docs et vidéos Google dévoile des mises à jour de l'espace de travail alimentées par l'IA lors de la conférence I/O 2025Lors de sa conférence annuelle des développeurs, Google a présenté des améliorations transforma
AWS lance Bedrock AgentCore : Plate-forme open-source pour le développement d'agents d'IA d'entreprise Voici le contenu HTML réécrit :AWS lance Bedrock AgentCore pour les agents d'IA d'entreprise Amazon Web Services (AWS) mise beaucoup sur les agents d'IA qui transforment les opérations commerciales, e
L'enregistreur vocal Akaluli AI améliore la productivité et la concentration de manière efficace Dans nos environnements de travail hyperconnectés, il est de plus en plus difficile de rester concentré lors de conversations cruciales. L'enregistreur vocal Akaluli AI offre une solution innovante à
Spotify augmente le coût de l'abonnement Premium en dehors des États-Unis Quelques jours après avoir annoncé des résultats financiers décevants, Spotify augmente le prix de ses abonnements sur plusieurs marchés internationaux. Le géant du streaming a confirmé lundi que les
Cairn RPG : un système de table facile à apprendre pour les nouveaux joueurs Vous voulez une porte d'entrée passionnante vers les jeux de rôle sur table qui ne submergera pas les nouveaux venus ? Imaginez que vous organisiez une aventure entière avec dix débutants complets en
Comparaison du modèle
Démarrer la comparaison
Retour en haut
OR