option
Maison
Liste des modèles Al
Qwen1.5-7B-Chat
Quantité de paramètre de modèle
7B
Quantité de paramètre de modèle
Organisation affiliée
Alibaba
Organisation affiliée
Source ouverte
Type de licence
Temps de libération
4 février 2024
Temps de libération
Introduction du modèle
Qwen1.5 est la version bêta de Qwen2, conservant une architecture de modèle de transformation uniquement décodeur avec l'activation SwiGLU, RoPE et des mécanismes d'attention multi-têtes. Elle propose neuf tailles de modèles et possède des capacités améliorées pour les modèles multilingues et de conversation, prenant en charge une longueur de contexte de 32,768 tokens. Tous les modèles incluent des invites système pour le jeu de rôle, et le code prend en charge une implémentation native dans transformers.
Faites glisser vers la gauche et la droite pour voir plus
Capacité de compréhension du langage Capacité de compréhension du langage
Capacité de compréhension du langage
Fait souvent des erreurs de jugement sémantique, conduisant à des déconnexions logiques évidentes dans les réponses.
4.5
Portée de la couverture des connaissances Portée de la couverture des connaissances
Portée de la couverture des connaissances
A des angles morts de connaissances importantes, montrant souvent des erreurs factuelles et répétant des informations obsolètes.
5.1
Capacité de raisonnement Capacité de raisonnement
Capacité de raisonnement
Incapable de maintenir des chaînes de raisonnement cohérentes, provoquant souvent une causalité inversée ou des erreurs de calcul.
2.2
Modèle connexe
Qwen2.5-7B-Instruct Comme Qwen2, les modèles de langue Qwen2.5 prennent en charge jusqu'à 128K tokens et peuvent générer jusqu'à 8K tokens. Ils maintiennent également une prise en charge multilingue pour plus de 29 langues, y compris le chinois, l'anglais, le français, l'espagnol, le portugais, l'allemand, l'italien, le russe, le japonais, le coréen, le vietnamien, le thaï, l'arabe et bien d'autres.
Qwen3-32B (Thinking) Qwen3 est la dernière génération de modèles de langue de grande taille dans la série Qwen, offrant un ensemble complet de modèles denses et experts mixtes (MoE).
Qwen1.5-72B-Chat Qwen1.5 est la version bêta de Qwen2, conservant son architecture de modèle de transformation de type decoder-only avec l'activation SwiGLU, RoPE et les mécanismes d'attention multi-têtes. Elle propose neuf tailles de modèles et possède des capacités améliorées en matière de multilinguisme et de modèles de conversation, prenant en charge une longueur de contexte de 32 768 tokens. Tous les modèles disposent de prompts système pour le jeu de rôles, et le code supporte une implémentation native dans transformers.
Qwen1.5-14B-Chat Qwen1.5 est la version bêta de Qwen2, conservant son architecture de modèle de transformation uniquement décodeur avec l'activation SwiGLU, RoPE et les mécanismes d'attention multi-têtes. Il offre neuf tailles de modèles et possède des capacités améliorées en matière de langues multiples et de modèles de conversation, prenant en charge une longueur de contexte de 32,768 tokens. Tous les modèles ont activé les invites de système pour le jeu de rôles, et le code prend en charge une implémentation native dans transformers.
Qwen-Max-0428 Qwen-Max est un modèle API produit par Alibaba. Il s'agit de la version 0428
Documents pertinents
Éducation alimentée par l'IA : Révolutionner l'apprentissage à tous les niveaux L'intelligence artificielle (IA) transforme l'éducation en fournissant des outils innovants pour engager les élèves et personnaliser l'apprentissage. Cet article examine comment les éducateurs peuvent
AI vs. Écrivains humains : Les machines peuvent-elles surpasser la créativité ? Dans une ère axée sur le contenu, le débat sur la capacité de l'intelligence artificielle (AI) à surpasser les écrivains humains s'intensifie. L'AI offre rapidité et économies de coûts, mais les humai
Les idoles IA révolutionnent le divertissement avec des performances virtuelles Le paysage du divertissement se transforme avec l'essor des idoles IA, des performeurs virtuels alimentés par l'intelligence artificielle. Ces stars numériques captivent les publics mondiaux grâce à u
Améliorer la précision de l'extraction d'emails par IA : Stratégies clés révélées L'utilisation de l'IA pour extraire des adresses email des conversations augmente l'efficacité, mais la précision reste un défi majeur pour les développeurs. Ce guide explore des stratégies éprouvées
Pages de coloriage alimentées par l'IA : Créez des designs époustouflants facilement Découvrez une plateforme IA innovante qui transforme la création de pages de coloriage captivantes. Parfait pour les artistes, les éducateurs ou les passionnés, cet outil offre une interface intuitive
Comparaison du modèle
Démarrer la comparaison
Retour en haut
OR