Option
Heim
Liste der Al -Modelle
Qwen1.5-7B-Chat
Modellparametermenge
7B
Modellparametermenge
Angehörige Organisation
Alibaba
Angehörige Organisation
Open Source
Lizenztyp
Freigabezeit
4. Februar 2024
Freigabezeit

Modelleinführung
Qwen1.5 ist die Beta-Version von Qwen2 und behält die Architektur eines Decoder-Only-Transformers mit SwiGLU-Aktivierung, RoPE und Multi-Head-Attention-Mechanismen bei. Es bietet neun Modellgrößen und verbesserte Multilinguismus- und Chat-Modell-Fähigkeiten, wobei eine Kontextlänge von 32.768 Tokens unterstützt wird. Alle Modelle haben System-Prompts für Rollenspiele aktiviert, und der Code unterstützt eine native Implementierung in Transformers.
Nach links und rechts swipen, um mehr anzuzeigen
Sprachverständnisfähigkeit Sprachverständnisfähigkeit
Sprachverständnisfähigkeit
Fehleinschätzt häufig semantische Fehleinschätzungen, was zu offensichtlichen logischen Trennungen in Antworten führt.
4.5
Wissensabdeckung Wissensabdeckung
Wissensabdeckung
Hat bedeutende kenntnisgebende Flecken, die häufig sachliche Fehler zeigt und veraltete Informationen wiederholt.
5.1
Argumentationsfähigkeit Argumentationsfähigkeit
Argumentationsfähigkeit
Es ist nicht möglich, kohärente Argumentationsketten aufrechtzuerhalten und häufig invertierte Kausalität oder Fehlkalkulationen zu verursachen.
2.2
Verwandter Modell
Qwen3-Next-80B-A3B-Thinking Die neueste Qwen3-Next-Serie der Qwen-Modelle, die durch eine innovative Modellarchitektur die Skalierungseffizienz verbessert.
Qwen3-235B-A22B-Thinking-2507 Qwen3 ist die neueste Generation großer Sprachmodelle der Qwen-Serie und bietet eine umfassende Suite von Dense- und Mixture-of-Experts-Modellen (MoE).
Qwen3-Max-2026-01-23 Das von Qwen neu veröffentlichte Flaggschiff-Argumentationsmodell führt zwei Innovationen ein: adaptives Tool-Aufrufen und Skalierung zur Testzeit.
Qwen3-Next-80B-A3B-Thinking Die neueste Qwen3-Next-Serie von Qwen-Modellen, die die Skalierungseffizienz durch eine innovative Modellarchitektur verbessert.
Qwen3-235B-A22B-Thinking-2507 Qwen3 ist die neueste Generation großer Sprachmodelle der Qwen-Reihe und bietet eine umfassende Suite von Dense- und Mixture-of-Experts (MoE)-Modellen.
Relevante Dokumente
Claude Opus 4.7 startet mit dem Grundsatz, dass Zuverlässigkeit vor Intelligenz geht Anthropic hat in diesem Jahr ein hohes Tempo beibehalten und fast jeden zweiten Tag neue Funktionen eingeführt. Das mit Spannung erwartete Claude Opus 4.7 wurde soeben offiziell veröffentlicht, und in
Haier bringt den weltweit leichtesten KI-Sport-Exoskelett-Roboter mit einem Gewicht von nur 1,75 kg auf den Markt Die Haier Group hat den weltweit leichtesten KI-gestützten Exoskelett-Roboter für den Sport vorgestellt – den Haier Exoskeleton Robot W3. Diese Markteinführung stellt einen neuen Branchenrekord in Sac
Yaoke Medias erste AIGC-Serie „Das Geheimnis der Bronzefiguren im Qinling-Gebirge“ startet heute mit KI-generierten Hauptdarstellern Heute ist der offizielle Starttag von Yaoke Medias AIGC-Fantasy-Mystery-Kurzserie „Die geheime Geschichte der Qinling-Bronze“. Mit den ersten beiden unter Vertrag genommenen KI-Schauspielern des Unter
Satya Nadella bereit, die neuen Vorteile der Vereinbarung mit OpenAI zu nutzen Am Mittwoch fragte ein Analyst von Wall Street den Microsoft-CEO Satya Nadella direkt, wie die überarbeitete Partnerschaft mit OpenAI die finanziellen Ergebnisse des Unternehmens beeinflussen würde.Nadella bezeichnete die neue Vereinbarung als einen
WordPress.com ermöglicht es nun KI-Agenten, Beiträge zu verfassen und zu veröffentlichen – und vieles mehr WordPress.com, die beliebte Webhosting- und Publishing-Plattform, setzt nun auf KI-Agenten – ein Schritt, der das Erscheinungsbild des Internets grundlegend verändern könnte. Das Unternehmen gab am Fr
Modellvergleich
Starten Sie den Vergleich
OR