option
Maison
Liste des modèles Al
Qwen1.5-72B-Chat
Quantité de paramètre de modèle
72B
Quantité de paramètre de modèle
Organisation affiliée
Alibaba
Organisation affiliée
Source ouverte
Type de licence
Temps de libération
4 février 2024
Temps de libération

Introduction du modèle
Qwen1.5 est la version bêta de Qwen2, conservant son architecture de modèle de transformation de type decoder-only avec l'activation SwiGLU, RoPE et les mécanismes d'attention multi-têtes. Elle propose neuf tailles de modèles et possède des capacités améliorées en matière de multilinguisme et de modèles de conversation, prenant en charge une longueur de contexte de 32 768 tokens. Tous les modèles disposent de prompts système pour le jeu de rôles, et le code supporte une implémentation native dans transformers.
Faites glisser vers la gauche et la droite pour voir plus
Capacité de compréhension du langage Capacité de compréhension du langage
Capacité de compréhension du langage
Fait souvent des erreurs de jugement sémantique, conduisant à des déconnexions logiques évidentes dans les réponses.
5.9
Portée de la couverture des connaissances Portée de la couverture des connaissances
Portée de la couverture des connaissances
Possède une connaissance fondamentale des disciplines traditionnelles, mais a une couverture limitée des champs interdisciplinaires de pointe.
7.0
Capacité de raisonnement Capacité de raisonnement
Capacité de raisonnement
Incapable de maintenir des chaînes de raisonnement cohérentes, provoquant souvent une causalité inversée ou des erreurs de calcul.
4.0
Modèle connexe
Qwen3-235B-A22B-Instruct-2507 Qwen3 est la dernière génération de grands modèles de langage de la série Qwen, offrant une suite complète de modèles denses et de modèles à mélange d'experts (MoE).
Qwen3-235B-A22B-Thinking-2507 Qwen3 est la dernière génération de grands modèles de langage de la série Qwen, offrant une suite complète de modèles denses et de modèles à mélange d'experts (MoE).
Qwen2.5-7B-Instruct Comme Qwen2, les modèles de langue Qwen2.5 prennent en charge jusqu'à 128K tokens et peuvent générer jusqu'à 8K tokens. Ils maintiennent également une prise en charge multilingue pour plus de 29 langues, y compris le chinois, l'anglais, le français, l'espagnol, le portugais, l'allemand, l'italien, le russe, le japonais, le coréen, le vietnamien, le thaï, l'arabe et bien d'autres.
Qwen3-32B (Thinking) Qwen3 est la dernière génération de modèles de langue de grande taille dans la série Qwen, offrant un ensemble complet de modèles denses et experts mixtes (MoE).
Qwen1.5-7B-Chat Qwen1.5 est la version bêta de Qwen2, conservant une architecture de modèle de transformation uniquement décodeur avec l'activation SwiGLU, RoPE et des mécanismes d'attention multi-têtes. Elle propose neuf tailles de modèles et possède des capacités améliorées pour les modèles multilingues et de conversation, prenant en charge une longueur de contexte de 32,768 tokens. Tous les modèles incluent des invites système pour le jeu de rôle, et le code prend en charge une implémentation native dans transformers.
Documents pertinents
L'IA révolutionne la production de films d'animation : Le guide ultime L'ère numérique a rendu l'animation de dessins animés alimentée par l'IA plus accessible que jamais. Ce guide complet couvre toutes les étapes de la réalisation de films d'animation avec l'IA, du déve
Les défis de l'éthique de l'IA : Équilibrer l'art, la culture et le progrès technologique L'intelligence artificielle est en train de remodeler fondamentalement la société moderne, influençant tout, des arts créatifs à l'éthique technologique. Cette étude examine la manière dont l'appréhen
Kimi K2 by Moonshot AI dévoile une percée de plusieurs milliards de paramètres en source ouverte L'IA entre dans une ère de transformationL'intelligence artificielle connaît un changement de paradigme, les modèles de langage atteignant une échelle et une sophistication sans précédent. Ces système
Google présente 9 nouvelles fonctionnalités passionnantes lors du lancement progressif de l'application Home L'application Google Home bénéficie d'importantes mises à jour en avant-première 2025Google a considérablement amélioré son application Home avec plusieurs fonctionnalités révolutionnaires actuellemen
Grammarly devient une plateforme de productivité alimentée par l'IA Grammarly a annoncé son intention d'acquérir l'application de productivité de messagerie électronique Superhuman, selon un communiqué officiel. Cette acquisition s'inscrit stratégiquement dans le cadr
Comparaison du modèle
Démarrer la comparaison
Retour en haut
OR