DeepSeek stellt ein KI-Modell vor, das mit den Systemen von Frontier konkurriert

Das chinesische KI-Labor DeepSeek hat zwei Vorschauversionen seines neuesten großen Sprachmodells, DeepSeek V4, veröffentlicht – ein mit Spannung erwartetes Update des letztjährigen Modells V3.2 und des dazugehörigen R1-Schlussfolgerungsmodells, das in der KI-Community großen Anklang gefunden hatte.
Das Unternehmen gibt an, dass sowohl DeepSeek V4 Flash als auch V4 Pro „Mixture-of-Experts“-Modelle sind, die jeweils über ein Kontextfenster von 1 Million Tokens verfügen – ausreichend für die Verarbeitung umfangreicher Codebasen oder Dokumente innerhalb von Prompts. Diese „Mixture-of-Experts“-Methode aktiviert pro Aufgabe nur eine bestimmte Teilmenge von Parametern, um die Inferenzkosten zu reduzieren.
Das Pro-Modell verfügt über insgesamt 1,6 Billionen Parameter (davon 49 Milliarden aktiv) und ist damit das größte verfügbare Modell mit offenem Gewicht. Es übertrifft Konkurrenten wie Moonshot AIs Kimi K 2.6 (1,1 Billionen) und MiniMax’ M1 (456 Milliarden) und ist mehr als doppelt so groß wie DeepSeek V3.2 (671 Milliarden). Das kleinere V4-Flash-Modell enthält 284 Milliarden Parameter (13 Milliarden aktive).
DeepSeek behauptet, dass architektonische Verbesserungen beide neuen Modelle effizienter und leistungsfähiger als DeepSeek V3.2 machen und damit die Lücke zu den derzeit führenden Modellen – sowohl Open-Source- als auch Closed-Source-Modellen – bei den Reasoning-Benchmarks fast schließen.
Das Labor berichtet, dass sein neues V4-Pro-Max-Modell seine Open-Source-Pendants bei allen Schlussfolgerungs-Benchmarks übertrifft und bei bestimmten Aufgaben die Leistung von OpenAI’s GPT-5.2 und Gemini 3.0 Pro übertrifft. Bei Benchmarks für Programmierwettbewerbe gibt DeepSeek an, dass die Leistung beider V4-Modelle „vergleichbar mit GPT-5.4“ ist.
Bei wissensbasierten Bewertungen scheinen die Modelle jedoch leicht hinter den führenden Modellen zurückzubleiben, insbesondere im Vergleich zu OpenAI’s GPT-5.4 und dem neuesten Google Gemini 3.1 Pro. Diese Lücke deutet laut dem Labor auf einen „Entwicklungsverlauf hin, der etwa 3 bis 6 Monate hinter den modernsten führenden Modellen zurückliegt“.
Im Gegensatz zu vielen Closed-Source-Konkurrenten, die die Generierung von Audio, Video und Bildern unterstützen, sind sowohl V4 Flash als auch V4 Pro reine Textmodelle.
Ein wesentlicher Vorteil ist, dass DeepSeek V4 deutlich kostengünstiger ist als aktuelle Spitzenmodelle. Das kleinere V4 Flash kostet 0,14 US-Dollar pro Million Eingabetoken und 0,28 US-Dollar pro Million Ausgabetoken und unterbietet damit GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini und Claude Haiku 4.5. Das größere V4 Pro-Modell kostet 0,145 US-Dollar pro Million Eingabetoken und 3,48 US-Dollar pro Million Ausgabetoken und bietet damit ebenfalls niedrigere Preise als Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 und GPT-5.4.
Dieser Start folgt einen Tag nach den Vorwürfen der USA, dass China mithilfe von Tausenden von Proxy-Konten in industriellem Maßstab geistiges Eigentum aus amerikanischen KI-Labors stiehlt. DeepSeek selbst sah sich Vorwürfen von Anthropic und OpenAI ausgesetzt, ihre KI-Modelle zu „destillieren“ oder im Wesentlichen zu kopieren.
Verwandter Artikel
DeepSeek V3.2 KI-Modell bietet Spitzenleistung bei minimalen Rechenkosten
Während große Technologieunternehmen Milliarden in Rechenleistung investieren, um hochmoderne KI-Modelle zu entwickeln, hat das chinesische Unternehmen DeepSeek ähnliche Ergebnisse durch intelligenter
Sicherheitschefs drängen auf rasche KI-Regulierung und verweisen auf die Risiken von Tools wie DeepSeek
In den Security Operations Centers und insbesondere bei den Chief Information Security Officers (CISOs) wächst die Besorgnis über den KI-Riesen DeepSeek aus China.Während die künstliche Intelligenz an
DeepSeek's R1 AI Model Update führt strengere Inhaltsmoderation ein, wie Tests zeigen
Das jüngste Modell des chinesischen KI-Start-ups DeepSeek, eine verbesserte Version seines R1-Systems, liefert außergewöhnliche Leistungen bei Codierungs-, Mathematik- und Allgemeinwissen-Benchmarks u
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

Das chinesische KI-Labor DeepSeek hat zwei Vorschauversionen seines neuesten großen Sprachmodells, DeepSeek V4, veröffentlicht – ein mit Spannung erwartetes Update des letztjährigen Modells V3.2 und des dazugehörigen R1-Schlussfolgerungsmodells, das in der KI-Community großen Anklang gefunden hatte.
Das Unternehmen gibt an, dass sowohl DeepSeek V4 Flash als auch V4 Pro „Mixture-of-Experts“-Modelle sind, die jeweils über ein Kontextfenster von 1 Million Tokens verfügen – ausreichend für die Verarbeitung umfangreicher Codebasen oder Dokumente innerhalb von Prompts. Diese „Mixture-of-Experts“-Methode aktiviert pro Aufgabe nur eine bestimmte Teilmenge von Parametern, um die Inferenzkosten zu reduzieren.
Das Pro-Modell verfügt über insgesamt 1,6 Billionen Parameter (davon 49 Milliarden aktiv) und ist damit das größte verfügbare Modell mit offenem Gewicht. Es übertrifft Konkurrenten wie Moonshot AIs Kimi K 2.6 (1,1 Billionen) und MiniMax’ M1 (456 Milliarden) und ist mehr als doppelt so groß wie DeepSeek V3.2 (671 Milliarden). Das kleinere V4-Flash-Modell enthält 284 Milliarden Parameter (13 Milliarden aktive).
DeepSeek behauptet, dass architektonische Verbesserungen beide neuen Modelle effizienter und leistungsfähiger als DeepSeek V3.2 machen und damit die Lücke zu den derzeit führenden Modellen – sowohl Open-Source- als auch Closed-Source-Modellen – bei den Reasoning-Benchmarks fast schließen.
Das Labor berichtet, dass sein neues V4-Pro-Max-Modell seine Open-Source-Pendants bei allen Schlussfolgerungs-Benchmarks übertrifft und bei bestimmten Aufgaben die Leistung von OpenAI’s GPT-5.2 und Gemini 3.0 Pro übertrifft. Bei Benchmarks für Programmierwettbewerbe gibt DeepSeek an, dass die Leistung beider V4-Modelle „vergleichbar mit GPT-5.4“ ist.
Bei wissensbasierten Bewertungen scheinen die Modelle jedoch leicht hinter den führenden Modellen zurückzubleiben, insbesondere im Vergleich zu OpenAI’s GPT-5.4 und dem neuesten Google Gemini 3.1 Pro. Diese Lücke deutet laut dem Labor auf einen „Entwicklungsverlauf hin, der etwa 3 bis 6 Monate hinter den modernsten führenden Modellen zurückliegt“.
Im Gegensatz zu vielen Closed-Source-Konkurrenten, die die Generierung von Audio, Video und Bildern unterstützen, sind sowohl V4 Flash als auch V4 Pro reine Textmodelle.
Ein wesentlicher Vorteil ist, dass DeepSeek V4 deutlich kostengünstiger ist als aktuelle Spitzenmodelle. Das kleinere V4 Flash kostet 0,14 US-Dollar pro Million Eingabetoken und 0,28 US-Dollar pro Million Ausgabetoken und unterbietet damit GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini und Claude Haiku 4.5. Das größere V4 Pro-Modell kostet 0,145 US-Dollar pro Million Eingabetoken und 3,48 US-Dollar pro Million Ausgabetoken und bietet damit ebenfalls niedrigere Preise als Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 und GPT-5.4.
Dieser Start folgt einen Tag nach den Vorwürfen der USA, dass China mithilfe von Tausenden von Proxy-Konten in industriellem Maßstab geistiges Eigentum aus amerikanischen KI-Labors stiehlt. DeepSeek selbst sah sich Vorwürfen von Anthropic und OpenAI ausgesetzt, ihre KI-Modelle zu „destillieren“ oder im Wesentlichen zu kopieren.
DeepSeek V3.2 KI-Modell bietet Spitzenleistung bei minimalen Rechenkosten
Während große Technologieunternehmen Milliarden in Rechenleistung investieren, um hochmoderne KI-Modelle zu entwickeln, hat das chinesische Unternehmen DeepSeek ähnliche Ergebnisse durch intelligenter
Sicherheitschefs drängen auf rasche KI-Regulierung und verweisen auf die Risiken von Tools wie DeepSeek
In den Security Operations Centers und insbesondere bei den Chief Information Security Officers (CISOs) wächst die Besorgnis über den KI-Riesen DeepSeek aus China.Während die künstliche Intelligenz an
DeepSeek's R1 AI Model Update führt strengere Inhaltsmoderation ein, wie Tests zeigen
Das jüngste Modell des chinesischen KI-Start-ups DeepSeek, eine verbesserte Version seines R1-Systems, liefert außergewöhnliche Leistungen bei Codierungs-, Mathematik- und Allgemeinwissen-Benchmarks u





Heim






