option
Maison
Liste des modèles Al
Qwen2.5-7B-Instruct
Quantité de paramètre de modèle
7B
Quantité de paramètre de modèle
Organisation affiliée
Alibaba
Organisation affiliée
Source ouverte
Type de licence
Temps de libération
19 septembre 2024
Temps de libération

Introduction du modèle
Comme Qwen2, les modèles de langue Qwen2.5 prennent en charge jusqu'à 128K tokens et peuvent générer jusqu'à 8K tokens. Ils maintiennent également une prise en charge multilingue pour plus de 29 langues, y compris le chinois, l'anglais, le français, l'espagnol, le portugais, l'allemand, l'italien, le russe, le japonais, le coréen, le vietnamien, le thaï, l'arabe et bien d'autres.
Faites glisser vers la gauche et la droite pour voir plus
Capacité de compréhension du langage Capacité de compréhension du langage
Capacité de compréhension du langage
Fait souvent des erreurs de jugement sémantique, conduisant à des déconnexions logiques évidentes dans les réponses.
4.6
Portée de la couverture des connaissances Portée de la couverture des connaissances
Portée de la couverture des connaissances
A des angles morts de connaissances importantes, montrant souvent des erreurs factuelles et répétant des informations obsolètes.
5.6
Capacité de raisonnement Capacité de raisonnement
Capacité de raisonnement
Incapable de maintenir des chaînes de raisonnement cohérentes, provoquant souvent une causalité inversée ou des erreurs de calcul.
4.4
Modèle connexe
Qwen3-235B-A22B-Instruct-2507 Qwen3 est la dernière génération de grands modèles de langage de la série Qwen, offrant une suite complète de modèles denses et de modèles à mélange d'experts (MoE).
Qwen3-235B-A22B-Thinking-2507 Qwen3 est la dernière génération de grands modèles de langage de la série Qwen, offrant une suite complète de modèles denses et de modèles à mélange d'experts (MoE).
Qwen3-32B (Thinking) Qwen3 est la dernière génération de modèles de langue de grande taille dans la série Qwen, offrant un ensemble complet de modèles denses et experts mixtes (MoE).
Qwen1.5-72B-Chat Qwen1.5 est la version bêta de Qwen2, conservant son architecture de modèle de transformation de type decoder-only avec l'activation SwiGLU, RoPE et les mécanismes d'attention multi-têtes. Elle propose neuf tailles de modèles et possède des capacités améliorées en matière de multilinguisme et de modèles de conversation, prenant en charge une longueur de contexte de 32 768 tokens. Tous les modèles disposent de prompts système pour le jeu de rôles, et le code supporte une implémentation native dans transformers.
Qwen1.5-7B-Chat Qwen1.5 est la version bêta de Qwen2, conservant une architecture de modèle de transformation uniquement décodeur avec l'activation SwiGLU, RoPE et des mécanismes d'attention multi-têtes. Elle propose neuf tailles de modèles et possède des capacités améliorées pour les modèles multilingues et de conversation, prenant en charge une longueur de contexte de 32,768 tokens. Tous les modèles incluent des invites système pour le jeu de rôle, et le code prend en charge une implémentation native dans transformers.
Documents pertinents
Transformez vos selfies en chefs-d'œuvre d'IA en 3D avec des drapeaux et des lettres via Bing Libérez votre potentiel créatif et créez de superbes portraits 3D améliorés par l'IA avec une touche nationale personnalisée ! Ce didacticiel facile à suivre explique comment transformer des images nu
Gemini Nano Banana améliore la cohérence et le contrôle de l'édition d'images à l'échelle de l'entreprise - il y a encore de la place pour l'amélioration Présentation de Gemini 2.5 Flash ImageGoogle a dévoilé Gemini 2.5 Flash Image, précédemment connu en interne sous le nom de "nanobanana" lors des tests bêta. Ce modèle avancé offre aux entreprises une
Innovations matérielles en matière d'IA : Les humanoïdes et les appareils audiovisuels occupent le devant de la scène à TechCrunch Disrupt 2025 TechCrunch Disrupt 2025 : L'avenir du matériel d'IAMarquez vos calendriers pour les 27-29 octobre, car TechCrunch Disrupt revient à Moscone West à San Francisco, rassemblant plus de 10 000 leaders de
Google étend l'accès à l'IA NotebookLM aux étudiants de moins de 18 ans Google a dévoilé d'importantes mises à jour de sa plateforme Classroom, en introduisant gratuitement les outils d'IA Gemini pour les enseignants et en élargissant l'accès à NotebookLM pour les étudian
ServiceNow lance une IA unifiée pour simplifier la complexité des entreprises ServiceNow lance Knowledge 2025 en dévoilant sa plateforme IA révolutionnaire—une solution unifiée conçue pour harmoniser les différents outils d'intelligence artificielle et assistants numériques à travers les environnements d'entreprise. En établis
Comparaison du modèle
Démarrer la comparaison
Retour en haut
OR