Option
Heim
Liste der Al -Modelle
DeepSeek-V2-Lite-Chat
Modellparametermenge
16B
Modellparametermenge
Angehörige Organisation
DeepSeek
Angehörige Organisation
Open Source
Lizenztyp
Freigabezeit
15. Mai 2024
Freigabezeit

Modelleinführung
DeepSeek-V2, ein starkes Mixture-of-Experts (MoE) Sprachmodell, das von DeepSeek vorgestellt wurde, das DeepSeek-V2-Lite ist eine leichtere Version davon.
Nach links und rechts swipen, um mehr anzuzeigen
Sprachverständnisfähigkeit Sprachverständnisfähigkeit
Sprachverständnisfähigkeit
Fehleinschätzt häufig semantische Fehleinschätzungen, was zu offensichtlichen logischen Trennungen in Antworten führt.
3.1
Wissensabdeckung Wissensabdeckung
Wissensabdeckung
Hat bedeutende kenntnisgebende Flecken, die häufig sachliche Fehler zeigt und veraltete Informationen wiederholt.
4.1
Argumentationsfähigkeit Argumentationsfähigkeit
Argumentationsfähigkeit
Es ist nicht möglich, kohärente Argumentationsketten aufrechtzuerhalten und häufig invertierte Kausalität oder Fehlkalkulationen zu verursachen.
2.8
Modellvergleich
Verwandter Modell
DeepSeek-V3-0324 DeepSeek-V3 übertrifft andere Open-Source-Modelle wie Qwen2.5-72B und Llama-3.1-405B in mehreren Bewertungen und erreicht die Leistung von erstklassigen Closed-Source-Modellen wie GPT-4 und Claude-3.5-Sonnet.
DeepSeek-R1-0528 Die neueste Version von Deepseek R1.
DeepSeek-V2-Chat-0628 DeepSeek-V2 ist ein starkes Mixture-of-Experts (MoE)-Sprachmodell, das durch kostengünstiges Training und effizientes Inferenz gekennzeichnet ist. Es besteht aus insgesamt 236 Billionen Parametern, wovon für jeden Token 21 Milliarden aktiviert sind. Im Vergleich zum DeepSeek 67B erreicht DeepSeek-V2 stärkere Leistungsmerkmale, spart dabei 42,5 % der Trainingskosten, reduziert das KV-Cache um 93,3 % und steigert die maximale Generierungsdurchsatz bis zu 5,76-mal.
DeepSeek-V2.5 DeepSeek-V2.5 ist eine aktualisierte Version, die DeepSeek-V2-Chat und DeepSeek-Coder-V2-Instruct kombiniert. Das neue Modell integriert die allgemeinen und Codierungsfähigkeiten der beiden vorherigen Versionen.
DeepSeek-V3-0324 DeepSeek-V3 übertrifft in mehreren Evaluierungen andere Open-Source-Modelle wie Qwen2.5-72B und Llama-3.1-405B und entspricht dem Leistungsniveau oberhalb geschlossener Modelle wie GPT-4 und Claude-3.5-Sonnet.
Relevante Dokumente
Google stellt KI-gestützte Tools für Gmail, Docs und Vids vor Google stellt KI-gestützte Workspace-Updates auf der I/O 2025 vorWährend seiner jährlichen Entwicklerkonferenz hat Google transformative KI-Verbesserungen für seine Workspace-Suite vorgestellt, die di
AWS bringt Bedrock AgentCore auf den Markt: Open-Source-Plattform für die Entwicklung von KI-Agenten für Unternehmen Hier ist der umgeschriebene HTML-Inhalt:AWS führt Bedrock AgentCore für KI-Agenten in Unternehmen ein Amazon Web Services (AWS) setzt voll auf KI-Agenten, die den Geschäftsbetrieb verändern, und stell
Akaluli AI Voice Recorder steigert die Produktivität und den Fokus effizienter In unseren hypervernetzten Arbeitsumgebungen wird es immer schwieriger, sich bei wichtigen Gesprächen zu konzentrieren. Der Akaluli AI Voice Recorder bietet eine innovative Lösung für dieses moderne D
Spotify erhöht Premium-Abonnementkosten in Märkten außerhalb der USA Spotify führt nur wenige Tage nach der Bekanntgabe seiner enttäuschenden Finanzergebnisse Preiserhöhungen für Abonnements in mehreren internationalen Märkten ein. Der Streaming-Riese bestätigte am Mon
Cairn RPG: Leicht zu erlernendes Tabletop-System für neue Spieler Sie wollen einen spannenden Einstieg in Tabletop-Rollenspiele, der Neulinge nicht überfordert? Stellen Sie sich vor, Sie organisieren mit zehn Anfängern in nur fünfzehn Minuten ein komplettes Abenteue
Modellvergleich
Starten Sie den Vergleich
Zurück nach oben
OR