DeepSeek V4 se lanzará en abril junto con el modelo Mengyuan de Tencent

Según un informe exclusivo de BaiMing Lab, el tan esperado DeepSeek V4 y el nuevo modelo MixFormer de Yao Shunyu tienen previsto su lanzamiento oficial en abril de 2026. DeepSeek V4 es un modelo multimodal de gran tamaño liderado por Liang Wenfeng. Tras un exhaustivo proceso de perfeccionamiento, se espera que logre avances significativos en la competencia de codificación y la memoria a largo plazo. Este lanzamiento se alinea con la trayectoria de investigación del equipo de DeepSeek en los últimos años, especialmente en el procesamiento de contenido visual y las capacidades de búsqueda impulsadas por IA.
La investigación de Liang Wenfeng se centra en explorar los mecanismos de la «memoria condicional». En enero de 2026, publicó un artículo titulado «Conditional Memory via Scalable Lookup», en el que esbozaba las teorías clave. Además, en diciembre de 2025, publicó otro estudio, «mHC: Manifold-Constrained Hyper-Connections», que optimiza aún más la arquitectura subyacente. Este trabajo tiene como objetivo abordar las limitaciones conocidas de los modelos Transformer en lo que respecta a la memoria y la estabilidad del entrenamiento. DeepSeek V4 no solo cuenta con una sólida potencia de procesamiento multimodal, sino que también se está optimizando en profundidad para chips nacionales, con el objetivo de convertirse en un modelo central que dependa totalmente de la infraestructura informática nacional.
Al mismo tiempo, el nuevo modelo MixFormer de Yao Shunyu también tiene previsto su lanzamiento en abril. Desde diciembre de 2025, Yao ocupa el cargo de científico jefe de IA en el Comité Ejecutivo de Tencent, al tiempo que supervisa los departamentos de infraestructura de IA y de modelos de lenguaje a gran escala. En febrero de 2026, presentó CL-bench, un novedoso punto de referencia de evaluación para el «aprendizaje contextual» que hace hincapié en el manejo de contextos largos y la usabilidad de los agentes. Los informes indican que el nuevo modelo de Yao contará con aproximadamente 3000 millones de parámetros, y que su equipo ha dado prioridad desde el principio a la aplicación práctica por encima de la mera competencia en la escala de parámetros.
Los inminentes lanzamientos de ambos modelos han suscitado un considerable interés en el mercado, lo que pone de relieve el acelerado progreso de China en materia de inteligencia artificial. Ya se trate de los avances de DeepSeek V4 en la memoria a largo plazo o de las mejoras del modelo MixFormer de Tencent en la evaluación de tareas del mundo real, ambos esfuerzos abordan fundamentalmente cómo los futuros modelos a gran escala pueden integrarse de forma más eficaz en entornos de producción.
Artículo relacionado
Se inaugura en Zibo la primera base de creación de series de cómics con IA de Baidu en Shandong
El 27 de abril, la provincia de Shandong alcanzó un hito en la creación cultural digital con la inauguración oficial de su primera base de creación de series de cómics con IA de Baidu en la Universida
Sandberg y Clegg se incorporan al consejo de administración de Nscale mientras la startup «Stargate Norway» alcanza una valoración de 14 600 millones de dólares
Ante el aumento de la demanda de centros de datos capaces de ofrecer capacidad de computación para IA a gran escala, Nscale, una empresa británica de infraestructura de IA respaldada por Nvidia, ha al
La valoración de 5.300 millones de dólares de Runway desafía a Google, mientras la IA aplicada al vídeo supera a la del lenguaje
Mientras que la mayoría de los gigantes de la IA han invertido miles de millones en modelos de lenguaje, la startup de vídeo generativo con IA Runway avanza a toda velocidad por un camino muy diferent
Recomendaciones de temas especiales relacionados
comentario (0)
0/500

Según un informe exclusivo de BaiMing Lab, el tan esperado DeepSeek V4 y el nuevo modelo MixFormer de Yao Shunyu tienen previsto su lanzamiento oficial en abril de 2026. DeepSeek V4 es un modelo multimodal de gran tamaño liderado por Liang Wenfeng. Tras un exhaustivo proceso de perfeccionamiento, se espera que logre avances significativos en la competencia de codificación y la memoria a largo plazo. Este lanzamiento se alinea con la trayectoria de investigación del equipo de DeepSeek en los últimos años, especialmente en el procesamiento de contenido visual y las capacidades de búsqueda impulsadas por IA.
La investigación de Liang Wenfeng se centra en explorar los mecanismos de la «memoria condicional». En enero de 2026, publicó un artículo titulado «Conditional Memory via Scalable Lookup», en el que esbozaba las teorías clave. Además, en diciembre de 2025, publicó otro estudio, «mHC: Manifold-Constrained Hyper-Connections», que optimiza aún más la arquitectura subyacente. Este trabajo tiene como objetivo abordar las limitaciones conocidas de los modelos Transformer en lo que respecta a la memoria y la estabilidad del entrenamiento. DeepSeek V4 no solo cuenta con una sólida potencia de procesamiento multimodal, sino que también se está optimizando en profundidad para chips nacionales, con el objetivo de convertirse en un modelo central que dependa totalmente de la infraestructura informática nacional.
Al mismo tiempo, el nuevo modelo MixFormer de Yao Shunyu también tiene previsto su lanzamiento en abril. Desde diciembre de 2025, Yao ocupa el cargo de científico jefe de IA en el Comité Ejecutivo de Tencent, al tiempo que supervisa los departamentos de infraestructura de IA y de modelos de lenguaje a gran escala. En febrero de 2026, presentó CL-bench, un novedoso punto de referencia de evaluación para el «aprendizaje contextual» que hace hincapié en el manejo de contextos largos y la usabilidad de los agentes. Los informes indican que el nuevo modelo de Yao contará con aproximadamente 3000 millones de parámetros, y que su equipo ha dado prioridad desde el principio a la aplicación práctica por encima de la mera competencia en la escala de parámetros.
Los inminentes lanzamientos de ambos modelos han suscitado un considerable interés en el mercado, lo que pone de relieve el acelerado progreso de China en materia de inteligencia artificial. Ya se trate de los avances de DeepSeek V4 en la memoria a largo plazo o de las mejoras del modelo MixFormer de Tencent en la evaluación de tareas del mundo real, ambos esfuerzos abordan fundamentalmente cómo los futuros modelos a gran escala pueden integrarse de forma más eficaz en entornos de producción.
Se inaugura en Zibo la primera base de creación de series de cómics con IA de Baidu en Shandong
El 27 de abril, la provincia de Shandong alcanzó un hito en la creación cultural digital con la inauguración oficial de su primera base de creación de series de cómics con IA de Baidu en la Universida
Sandberg y Clegg se incorporan al consejo de administración de Nscale mientras la startup «Stargate Norway» alcanza una valoración de 14 600 millones de dólares
Ante el aumento de la demanda de centros de datos capaces de ofrecer capacidad de computación para IA a gran escala, Nscale, una empresa británica de infraestructura de IA respaldada por Nvidia, ha al
La valoración de 5.300 millones de dólares de Runway desafía a Google, mientras la IA aplicada al vídeo supera a la del lenguaje
Mientras que la mayoría de los gigantes de la IA han invertido miles de millones en modelos de lenguaje, la startup de vídeo generativo con IA Runway avanza a toda velocidad por un camino muy diferent





Hogar






