Heim
DeepSeek V4 soll im April zusammen mit Tencent’s Mengyuan-Modell auf den Markt kommen

Laut einem Exklusivbericht von BaiMing Lab sollen das mit Spannung erwartete DeepSeek V4 und Yao Shunyus neues MixFormer-Modell im April 2026 offiziell veröffentlicht werden. DeepSeek V4 ist ein multimodales Großmodell, das von Liang Wenfeng geleitet wird. Nach umfangreicher Weiterentwicklung wird erwartet, dass es bedeutende Durchbrüche in den Bereichen Codierungskompetenz und Langzeitgedächtnis erzielen wird. Diese Veröffentlichung steht im Einklang mit der Forschungsausrichtung des DeepSeek-Teams in den letzten Jahren, insbesondere in den Bereichen visuelle Inhaltsverarbeitung und KI-gestützte Suchfunktionen.
Liang Wenfengs Forschung konzentriert sich auf die Erforschung von Mechanismen des „bedingten Gedächtnisses“. Im Januar 2026 veröffentlichte er einen Artikel mit dem Titel „Conditional Memory via Scalable Lookup“, in dem er die wichtigsten Theorien darlegte. Darüber hinaus veröffentlichte er im Dezember 2025 eine weitere Studie mit dem Titel „mHC: Manifold-Constrained Hyper-Connections“, die die zugrunde liegende Architektur weiter optimiert. Diese Arbeit zielt darauf ab, bekannte Einschränkungen von Transformer-Modellen in Bezug auf Speicher und Trainingsstabilität zu beheben. DeepSeek V4 verfügt nicht nur über eine robuste multimodale Rechenleistung, sondern wird auch intensiv für inländische Chips optimiert, mit dem Ziel, ein Kernmodell zu werden, das vollständig auf der heimischen Recheninfrastruktur basiert.
Gleichzeitig ist für April die Veröffentlichung von Yao Shunyus neuem MixFormer-Modell geplant. Seit Dezember 2025 ist Yao als Chief AI Scientist im Vorstand von Tencent tätig und leitet gleichzeitig die Abteilungen für KI-Infrastruktur und große Sprachmodelle. Im Februar 2026 stellte er CL-bench vor, einen neuartigen Bewertungs-Benchmark für „kontextuelles Lernen“, der den Schwerpunkt auf die Verarbeitung langer Kontexte und die Benutzerfreundlichkeit für Agenten legt. Berichten zufolge wird Yaos neues Modell rund 3 Milliarden Parameter umfassen, wobei sein Team von Anfang an den praktischen Einsatz gegenüber einem reinen Wettstreit um die Parametergröße priorisiert.
Die bevorstehende Einführung beider Modelle hat großes Interesse am Markt geweckt und unterstreicht Chinas rasanten Fortschritt im Bereich der künstlichen Intelligenz. Ob es sich nun um die Fortschritte von DeepSeek V4 im Bereich des Langzeitgedächtnisses oder um die Verbesserungen des MixFormer-Modells von Tencent bei der Bewertung realer Aufgaben handelt – beide Ansätze befassen sich grundlegend damit, wie zukünftige große Modelle effektiver in Produktionsumgebungen integriert werden können.
Verwandter Artikel
BuzzFeed gründet eine Tochtergesellschaft für KI-basierte Junk-Apps
Inmitten einer schweren Unternehmenskrise startet der ehemalige Digitalmedien-Riese BuzzFeed ein ehrgeiziges Selbstrettungs-Experiment, das auf künstlicher Intelligenz basiert. Auf der jüngsten SXSW-K
ChatGPT-Erwachsenenmodus erneut verschoben; Ultraman: Intelligenz hat Vorrang
OpenAI verschiebt umstrittene Funktion erneut und konzentriert sich auf Personalisierung und proaktive InteraktionOb „unangemessene Inhalte“ Teil eines produktiven KI-Tools sein sollten, sorgt in der
Baidu Health testet intern den KI-Arztassistenten „DoctorClaw“ für die Recherche wissenschaftlicher Informationen und die Unterstützung im Büro auf kurze Sicht
Baidu Health hat Berichten zufolge mit internen Tests eines professionellen KI-Assistenten für Ärzte begonnen. Das intern als „DoctorClaw“ (die „Lobster Doctor“-Version) bezeichnete Produkt stellt ein
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)

Laut einem Exklusivbericht von BaiMing Lab sollen das mit Spannung erwartete DeepSeek V4 und Yao Shunyus neues MixFormer-Modell im April 2026 offiziell veröffentlicht werden. DeepSeek V4 ist ein multimodales Großmodell, das von Liang Wenfeng geleitet wird. Nach umfangreicher Weiterentwicklung wird erwartet, dass es bedeutende Durchbrüche in den Bereichen Codierungskompetenz und Langzeitgedächtnis erzielen wird. Diese Veröffentlichung steht im Einklang mit der Forschungsausrichtung des DeepSeek-Teams in den letzten Jahren, insbesondere in den Bereichen visuelle Inhaltsverarbeitung und KI-gestützte Suchfunktionen.
Liang Wenfengs Forschung konzentriert sich auf die Erforschung von Mechanismen des „bedingten Gedächtnisses“. Im Januar 2026 veröffentlichte er einen Artikel mit dem Titel „Conditional Memory via Scalable Lookup“, in dem er die wichtigsten Theorien darlegte. Darüber hinaus veröffentlichte er im Dezember 2025 eine weitere Studie mit dem Titel „mHC: Manifold-Constrained Hyper-Connections“, die die zugrunde liegende Architektur weiter optimiert. Diese Arbeit zielt darauf ab, bekannte Einschränkungen von Transformer-Modellen in Bezug auf Speicher und Trainingsstabilität zu beheben. DeepSeek V4 verfügt nicht nur über eine robuste multimodale Rechenleistung, sondern wird auch intensiv für inländische Chips optimiert, mit dem Ziel, ein Kernmodell zu werden, das vollständig auf der heimischen Recheninfrastruktur basiert.
Gleichzeitig ist für April die Veröffentlichung von Yao Shunyus neuem MixFormer-Modell geplant. Seit Dezember 2025 ist Yao als Chief AI Scientist im Vorstand von Tencent tätig und leitet gleichzeitig die Abteilungen für KI-Infrastruktur und große Sprachmodelle. Im Februar 2026 stellte er CL-bench vor, einen neuartigen Bewertungs-Benchmark für „kontextuelles Lernen“, der den Schwerpunkt auf die Verarbeitung langer Kontexte und die Benutzerfreundlichkeit für Agenten legt. Berichten zufolge wird Yaos neues Modell rund 3 Milliarden Parameter umfassen, wobei sein Team von Anfang an den praktischen Einsatz gegenüber einem reinen Wettstreit um die Parametergröße priorisiert.
Die bevorstehende Einführung beider Modelle hat großes Interesse am Markt geweckt und unterstreicht Chinas rasanten Fortschritt im Bereich der künstlichen Intelligenz. Ob es sich nun um die Fortschritte von DeepSeek V4 im Bereich des Langzeitgedächtnisses oder um die Verbesserungen des MixFormer-Modells von Tencent bei der Bewertung realer Aufgaben handelt – beide Ansätze befassen sich grundlegend damit, wie zukünftige große Modelle effektiver in Produktionsumgebungen integriert werden können.
BuzzFeed gründet eine Tochtergesellschaft für KI-basierte Junk-Apps
Inmitten einer schweren Unternehmenskrise startet der ehemalige Digitalmedien-Riese BuzzFeed ein ehrgeiziges Selbstrettungs-Experiment, das auf künstlicher Intelligenz basiert. Auf der jüngsten SXSW-K
ChatGPT-Erwachsenenmodus erneut verschoben; Ultraman: Intelligenz hat Vorrang
OpenAI verschiebt umstrittene Funktion erneut und konzentriert sich auf Personalisierung und proaktive InteraktionOb „unangemessene Inhalte“ Teil eines produktiven KI-Tools sein sollten, sorgt in der
Baidu Health testet intern den KI-Arztassistenten „DoctorClaw“ für die Recherche wissenschaftlicher Informationen und die Unterstützung im Büro auf kurze Sicht
Baidu Health hat Berichten zufolge mit internen Tests eines professionellen KI-Assistenten für Ärzte begonnen. Das intern als „DoctorClaw“ (die „Lobster Doctor“-Version) bezeichnete Produkt stellt ein











