Option
Modellparametermenge
671B
Modellparametermenge
Angehörige Organisation
DeepSeek
Angehörige Organisation
Open Source
Lizenztyp
Freigabezeit
20. Januar 2025
Freigabezeit
Modelleinführung
DeepSeek-R1 nutzte während der Nachtrainingsphase umfangreiche verstärkte Lernmethoden, wodurch die Modellfähigkeiten im logischen Denken durch nur eine minimale Menge annotierter Daten erheblich verbessert wurden. Bei Aufgaben im Bereich Mathematik, Codierung und natürlicher Sprachinferenz ist dessen Leistung vergleichbar mit dem offiziellen Release von OpenAI's o1.
Nach links und rechts swipen, um mehr anzuzeigen
Sprachverständnisfähigkeit Sprachverständnisfähigkeit
Sprachverständnisfähigkeit
In der Lage, komplexe Kontexte zu verstehen und logisch kohärente Sätze zu erzeugen, obwohl sie gelegentlich in der Tonkontrolle ausgeschaltet werden.
7.5
Wissensabdeckung Wissensabdeckung
Wissensabdeckung
Deckt mehr als 200 spezialisierte Felder ab und integriert die neuesten Forschungsergebnisse und interkulturelles Wissen in Echtzeit.
9.0
Argumentationsfähigkeit Argumentationsfähigkeit
Argumentationsfähigkeit
Kann logische Argumentation mit mehr als drei Schritten ausführen, obwohl die Effizienz beim Umgang mit nichtlinearen Beziehungen sinkt.
8.5
Verwandter Modell
DeepSeek-V2-Chat-0628 DeepSeek-V2 ist ein starkes Mixture-of-Experts (MoE)-Sprachmodell, das durch kostengünstiges Training und effizientes Inferenz gekennzeichnet ist. Es besteht aus insgesamt 236 Billionen Parametern, wovon für jeden Token 21 Milliarden aktiviert sind. Im Vergleich zum DeepSeek 67B erreicht DeepSeek-V2 stärkere Leistungsmerkmale, spart dabei 42,5 % der Trainingskosten, reduziert das KV-Cache um 93,3 % und steigert die maximale Generierungsdurchsatz bis zu 5,76-mal.
DeepSeek-V2.5 DeepSeek-V2.5 ist eine aktualisierte Version, die DeepSeek-V2-Chat und DeepSeek-Coder-V2-Instruct kombiniert. Das neue Modell integriert die allgemeinen und Codierungsfähigkeiten der beiden vorherigen Versionen.
DeepSeek-V3-0324 DeepSeek-V3 übertrifft in mehreren Evaluierungen andere Open-Source-Modelle wie Qwen2.5-72B und Llama-3.1-405B und entspricht dem Leistungsniveau oberhalb geschlossener Modelle wie GPT-4 und Claude-3.5-Sonnet.
DeepSeek-V2-Lite-Chat DeepSeek-V2, ein starkes Mixture-of-Experts (MoE) Sprachmodell, das von DeepSeek vorgestellt wurde, das DeepSeek-V2-Lite ist eine leichte Version davon.
DeepSeek-V2-Chat DeepSeek-V2 ist ein starkes Mixture-of-Experts (MoE)-Sprachmodell, das durch kostengünstiges Training und effizientes Inferenz gekennzeichnet ist. Es besteht aus insgesamt 236 Billionen Parametern, wovon für jeden Token 21 Milliarden aktiviert sind. Im Vergleich zum DeepSeek 67B erreicht DeepSeek-V2 stärkere Leistungen und spart dabei 42,5 % der Trainingskosten, reduziert den KV-Cache um 93,3 % und steigert die maximale Generierungsdurchsatz bis zu 5,76-mal.
Relevante Dokumente
KI-gesteuertes Reisen: Planen Sie Ihren perfekten Urlaub mit Leichtigkeit Die Planung eines Urlaubs kann überwältigend sein, da endlose Suchen und Bewertungen Aufregung in Stress verwandeln. KI-gestützte Reiseplanung ändert dies und macht den Prozess reibungslos und angeneh
AI-gestütztes NoteGPT verändert das YouTube-Lernerlebnis In der heutigen schnelllebigen Welt ist effektives Lernen unerlässlich. NoteGPT ist eine dynamische Chrome-Erweiterung, die die Art und Weise, wie Sie mit YouTube-Inhalten interagieren, revolutioniert
Community Union und Google arbeiten zusammen, um KI-Fähigkeiten für britische Arbeiter zu fördern Anmerkung der Redaktion: Google hat sich mit Community Union in Großbritannien zusammengeschlossen, um zu zeigen, wie KI-Fähigkeiten die Kompetenzen von Büro- und Betriebsmitarbeitern verbessern könne
Magi-1 enthüllt revolutionäre Open-Source-KI-Videogenerierungstechnologie Der Bereich der KI-gestützten Videoproduktion entwickelt sich rasant weiter, und Magi-1 markiert einen bahnbrechenden Meilenstein. Dieses innovative Open-Source-Modell bietet unerreichte Präzision bei
AI Ethik: Navigation von Risiken und Verantwortlichkeiten in der Technologieentwicklung Künstliche Intelligenz (AI) verändert Industrien, von Gesundheitswesen bis Logistik, und bietet enormes Fortschrittspotenzial. Doch ihr schneller Fortschritt bringt erhebliche Risiken, die sorgfältige
Modellvergleich
Starten Sie den Vergleich
Zurück nach oben
OR