Name: Qwen1.5-72B-Chat
Rating: 1 (35 reviews)
Author: Alibaba

Maison

Liste des modèles Al

Qwen1.5-72B-Chat

Ajouter la comparaison

72B

Quantité de paramètre de modèle

Alibaba

Organisation affiliée

Source ouverte

Type de licence

4 février 2024

Temps de libération

Site officiel

Documentation du modèle

Rapport technique

Personnalités associées

Jack Ma

Ana Rojo Echeburúa

Junyang Lin

Zhou Jingren

Introduction du modèle

Qwen1.5 est la version bêta de Qwen2, conservant son architecture de modèle de transformation de type decoder-only avec l'activation SwiGLU, RoPE et les mécanismes d'attention multi-têtes. Elle propose neuf tailles de modèles et possède des capacités améliorées en matière de multilinguisme et de modèles de conversation, prenant en charge une longueur de contexte de 32 768 tokens. Tous les modèles disposent de prompts système pour le jeu de rôles, et le code supporte une implémentation native dans transformers.

Score complet Dialogue du langage Réserve de connaissances Association de raisonnement Calcul mathématique Écriture de code Commande suivante

Faites glisser vers la gauche et la droite pour voir plus

Capacité de compréhension du langage

Fait souvent des erreurs de jugement sémantique, conduisant à des déconnexions logiques évidentes dans les réponses.

5.9

Portée de la couverture des connaissances

Possède une connaissance fondamentale des disciplines traditionnelles, mais a une couverture limitée des champs interdisciplinaires de pointe.

7.0

Capacité de raisonnement

Incapable de maintenir des chaînes de raisonnement cohérentes, provoquant souvent une causalité inversée ou des erreurs de calcul.

4.0

Comparaison du modèle

Qwen1.5-72B-Chat vs Qwen2.5-7B-Instruct Comme Qwen2, les modèles de langue Qwen2.5 prennent en charge jusqu'à 128K tokens et peuvent générer jusqu'à 8K tokens. Ils maintiennent également une prise en charge multilingue pour plus de 29 langues, y compris le chinois, l'anglais, le français, l'espagnol, le portugais, l'allemand, l'italien, le russe, le japonais, le coréen, le vietnamien, le thaï, l'arabe et bien d'autres.

Qwen1.5-72B-Chat vs Hunyuan-T1-20250822 Le modèle de raisonnement profond développé indépendamment par Tencent porte le numéro de version hunyuan-t1-20250822.

Qwen1.5-72B-Chat vs Spark-X1 Le modèle d'inférence Spark X1 publié par iFlytek, sur la base de tâches mathématiques nationales de premier plan, compare les performances de tâches générales telles que l'inférence, la génération de texte et la compréhension du langage avec OpenAI o1 et DeepSeek R1.

Qwen1.5-72B-Chat vs Doubao-Seed-1.6-251015 (Thinking) Le modèle de raisonnement profond publié par ByteDance, qui prend en charge la commutation manuelle du raisonnement profond, et ses performances sont considérablement améliorées par rapport à doubao-1.5.

Qwen1.5-72B-Chat vs Doubao-Seed-1.6-thinking-250715 La dernière version du modèle de la série seed lancé par ByteDance, qui prend en charge le mode de réflexion.

Modèle connexe

Qwen3-Next-80B-A3B-Thinking La dernière série Qwen3-Next des modèles Qwen, qui améliore l'efficacité de la mise à l'échelle grâce à une architecture de modèle innovante.

Qwen3-235B-A22B-Thinking-2507 Qwen3 est la dernière génération de grands modèles linguistiques de la série Qwen, offrant une suite complète de modèles denses et de modèles mixtes d'experts (MoE).

Qwen3-Max-2026-01-23 Le modèle de raisonnement phare récemment lancé par Qwen introduit deux innovations : l'appel adaptatif d'outils et la mise à l'échelle au moment du test.

Qwen3-Next-80B-A3B-Thinking La dernière série Qwen3-Next des modèles Qwen, qui améliore l'efficacité de la mise à l'échelle grâce à une architecture de modèle innovante.

Qwen3-235B-A22B-Thinking-2507 Qwen3 est la dernière génération de grands modèles linguistiques de la série Qwen, offrant une suite complète de modèles denses et de modèles de mélange d'experts (MoE).

Documents pertinents

Lei Jun confirme que l'agent IA de bureau de Xiaomi, MiClaw, est en cours de développement, tandis que MiMo-V2-Pro est lancé sur toutes les plateformes Lors du Forum de haut niveau sur le développement de la Chine 2026, Lei Jun, du groupe Xiaomi, a confirmé que la version de bureau tant attendue de l'agent IA « MiClaw » (crabe) figurait désormais dan

OpenAI relance son activité dans le domaine de la robotique, tandis qu'Automan recherche des ingénieurs pour la R&D en matière d'infrastructures Le 1er juin, Sam Altman, PDG d'OpenAI, a annoncé sur les réseaux sociaux que l'entreprise faisait son retour dans le domaine de la robotique, en publiant des offres d'emploi pour l'équipe OpenAI Robot

Bain prévoit un marché du SaaS de 100 milliards de dollars dans le domaine de l'automatisation par l'IA agentique Bain & Company a estimé à 100 milliards de dollars la taille du marché américain pour les entreprises SaaS exploitant l'IA agentique. Selon le cabinet, ce marché résulte de l'automatisation des tâches

La politique rendant obligatoire l'utilisation de la recherche par IA provoque un exode, tandis que DuckDuckGo enregistre une forte augmentation du nombre d'utilisateurs Suite à l'annonce faite par Google lors de sa conférence I/O 2026 concernant une refonte complète de son moteur de recherche axée sur l'IA, de nombreux utilisateurs se sont mis à rechercher des altern

Xiaohongshu se restructure : Conan nommé président, création d'un département dédié à l'IA et d'une division internationale Rednote Le 30 avril, Xiaohongshu a adressé une note interne à l'ensemble de ses employés pour annoncer le lancement d'une nouvelle restructuration organisationnelle. Au cœur de cette évolution figure l'intégr

Comparaison du modèle

Démarrer la comparaison