Maison
DeepSeek V4 devrait être lancé en avril, parallèlement au modèle Mengyuan de Tencent

Selon un reportage exclusif du BaiMing Lab, le très attendu DeepSeek V4 et le nouveau modèle MixFormer de Yao Shunyu devraient être officiellement lancés en avril 2026. DeepSeek V4 est un grand modèle multimodal dirigé par Liang Wenfeng. Après avoir fait l'objet d'améliorations approfondies, il devrait permettre des avancées significatives en matière de compétences de codage et de mémoire à long terme. Ce lancement s'inscrit dans la lignée des travaux de recherche menés ces dernières années par l'équipe DeepSeek, notamment dans le domaine du traitement des contenus visuels et des capacités de recherche basées sur l'IA.
Les recherches de Liang Wenfeng se concentrent sur l'exploration des mécanismes de « mémoire conditionnelle ». En janvier 2026, il a publié un article intitulé « Conditional Memory via Scalable Lookup », exposant les théories clés. De plus, en décembre 2025, il a publié une autre étude, « mHC : Manifold-Constrained Hyper-Connections », qui optimise davantage l'architecture sous-jacente. Ce travail vise à remédier aux limites connues des modèles Transformer en matière de mémoire et de stabilité de l'entraînement. DeepSeek V4 dispose non seulement d'une puissance de traitement multimodal robuste, mais fait également l'objet d'une optimisation approfondie pour les puces nationales, dans le but de devenir un modèle central s'appuyant entièrement sur l'infrastructure informatique nationale.
Parallèlement, le nouveau modèle MixFormer de Yao Shunyu devrait également être lancé en avril. Depuis décembre 2025, Yao occupe le poste de directeur scientifique en IA au sein du comité exécutif de Tencent, tout en supervisant les départements chargés de l'infrastructure IA et des grands modèles linguistiques. En février 2026, il a présenté CL-bench, un nouveau benchmark d'évaluation pour l'« apprentissage contextuel » qui met l'accent sur la gestion des contextes longs et la facilité d'utilisation des agents. Selon certaines informations, le nouveau modèle de Yao comporterait environ 3 milliards de paramètres, son équipe ayant privilégié dès le départ les applications pratiques plutôt que la simple course à l'échelle des paramètres.
Les lancements imminents de ces deux modèles ont suscité un intérêt considérable sur le marché, soulignant les progrès accélérés de la Chine en matière d'intelligence artificielle. Qu'il s'agisse des avancées de DeepSeek V4 en matière de mémoire à long terme ou des améliorations apportées au modèle MixFormer de Tencent dans l'évaluation des tâches du monde réel, ces deux initiatives abordent fondamentalement la manière dont les futurs modèles de grande envergure pourront être intégrés plus efficacement dans les environnements de production.
Article connexe
Sandberg et Clegg rejoignent le conseil d'administration de Nscale alors que la start-up « Stargate Norway » atteint une valorisation de 14,6 milliards de dollars
Alors que la demande explose pour des centres de données capables de fournir des capacités de calcul IA à grande échelle, Nscale, une entreprise britannique spécialisée dans les infrastructures d'IA s
Avec une valorisation de 5,3 milliards de dollars, Runway défie Google alors que l'IA vidéo prend le pas sur l'IA linguistique
Alors que la plupart des géants de l'IA ont investi des milliards dans les modèles linguistiques, la start-up Runway, spécialisée dans la vidéo générative par IA, suit une voie très différente. Selon
Google va renforcer son investissement dans Anthropic, pour un montant total pouvant atteindre 40 milliards de dollars
Dans la course effrénée à l'IA, les géants de la tech multiplient les initiatives audacieuses. Selon les dernières informations, Google prévoit d'investir jusqu'à 10 milliards de dollars dans la start
Recommandations de sujets spéciaux liés
commentaires (0)

Selon un reportage exclusif du BaiMing Lab, le très attendu DeepSeek V4 et le nouveau modèle MixFormer de Yao Shunyu devraient être officiellement lancés en avril 2026. DeepSeek V4 est un grand modèle multimodal dirigé par Liang Wenfeng. Après avoir fait l'objet d'améliorations approfondies, il devrait permettre des avancées significatives en matière de compétences de codage et de mémoire à long terme. Ce lancement s'inscrit dans la lignée des travaux de recherche menés ces dernières années par l'équipe DeepSeek, notamment dans le domaine du traitement des contenus visuels et des capacités de recherche basées sur l'IA.
Les recherches de Liang Wenfeng se concentrent sur l'exploration des mécanismes de « mémoire conditionnelle ». En janvier 2026, il a publié un article intitulé « Conditional Memory via Scalable Lookup », exposant les théories clés. De plus, en décembre 2025, il a publié une autre étude, « mHC : Manifold-Constrained Hyper-Connections », qui optimise davantage l'architecture sous-jacente. Ce travail vise à remédier aux limites connues des modèles Transformer en matière de mémoire et de stabilité de l'entraînement. DeepSeek V4 dispose non seulement d'une puissance de traitement multimodal robuste, mais fait également l'objet d'une optimisation approfondie pour les puces nationales, dans le but de devenir un modèle central s'appuyant entièrement sur l'infrastructure informatique nationale.
Parallèlement, le nouveau modèle MixFormer de Yao Shunyu devrait également être lancé en avril. Depuis décembre 2025, Yao occupe le poste de directeur scientifique en IA au sein du comité exécutif de Tencent, tout en supervisant les départements chargés de l'infrastructure IA et des grands modèles linguistiques. En février 2026, il a présenté CL-bench, un nouveau benchmark d'évaluation pour l'« apprentissage contextuel » qui met l'accent sur la gestion des contextes longs et la facilité d'utilisation des agents. Selon certaines informations, le nouveau modèle de Yao comporterait environ 3 milliards de paramètres, son équipe ayant privilégié dès le départ les applications pratiques plutôt que la simple course à l'échelle des paramètres.
Les lancements imminents de ces deux modèles ont suscité un intérêt considérable sur le marché, soulignant les progrès accélérés de la Chine en matière d'intelligence artificielle. Qu'il s'agisse des avancées de DeepSeek V4 en matière de mémoire à long terme ou des améliorations apportées au modèle MixFormer de Tencent dans l'évaluation des tâches du monde réel, ces deux initiatives abordent fondamentalement la manière dont les futurs modèles de grande envergure pourront être intégrés plus efficacement dans les environnements de production.
Sandberg et Clegg rejoignent le conseil d'administration de Nscale alors que la start-up « Stargate Norway » atteint une valorisation de 14,6 milliards de dollars
Alors que la demande explose pour des centres de données capables de fournir des capacités de calcul IA à grande échelle, Nscale, une entreprise britannique spécialisée dans les infrastructures d'IA s
Avec une valorisation de 5,3 milliards de dollars, Runway défie Google alors que l'IA vidéo prend le pas sur l'IA linguistique
Alors que la plupart des géants de l'IA ont investi des milliards dans les modèles linguistiques, la start-up Runway, spécialisée dans la vidéo générative par IA, suit une voie très différente. Selon
Google va renforcer son investissement dans Anthropic, pour un montant total pouvant atteindre 40 milliards de dollars
Dans la course effrénée à l'IA, les géants de la tech multiplient les initiatives audacieuses. Selon les dernières informations, Google prévoit d'investir jusqu'à 10 milliards de dollars dans la start











