DeepSeek V4 deve ser lançado em abril, juntamente com o modelo Mengyuan da Tencent

De acordo com uma reportagem exclusiva do BaiMing Lab, o tão aguardado DeepSeek V4 e o novo modelo MixFormer, de Yao Shunyu, têm lançamento oficial previsto para abril de 2026. O DeepSeek V4 é um grande modelo multimodal liderado por Liang Wenfeng. Após um extenso aperfeiçoamento, espera-se que ele alcance avanços significativos em proficiência de codificação e memória de longo prazo. Este lançamento está alinhado com a trajetória de pesquisa da equipe do DeepSeek nos últimos anos, particularmente no processamento de conteúdo visual e nos recursos de pesquisa impulsionados por IA.
A pesquisa de Liang Wenfeng concentra-se na exploração de mecanismos de “memória condicional”. Em janeiro de 2026, ele publicou um artigo intitulado “Conditional Memory via Scalable Lookup”, delineando as principais teorias. Além disso, em dezembro de 2025, ele divulgou outro estudo, “mHC: Manifold-Constrained Hyper-Connections”, que otimiza ainda mais a arquitetura subjacente. Esse trabalho visa abordar as limitações conhecidas dos modelos Transformer no que diz respeito à memória e à estabilidade do treinamento. O DeepSeek V4 não apenas possui um robusto poder de processamento multimodal, mas também está sendo profundamente otimizado para chips nacionais, com o objetivo de se tornar um modelo central totalmente dependente da infraestrutura de computação nacional.
Paralelamente, o novo modelo MixFormer de Yao Shunyu também está programado para ser lançado em abril. Desde dezembro de 2025, Yao atua como Cientista-Chefe de IA no Comitê Executivo da Tencent, ao mesmo tempo em que supervisiona os departamentos de Infraestrutura de IA e de grandes modelos de linguagem. Em fevereiro de 2026, ele apresentou o CL-bench, um novo benchmark de avaliação para “aprendizado contextual” que enfatiza o tratamento de contextos longos e a usabilidade do agente. Relatórios indicam que o novo modelo de Yao contará com cerca de 3 bilhões de parâmetros, com sua equipe priorizando a aplicação prática desde o início em vez da mera competição em escala de parâmetros.
Os lançamentos iminentes de ambos os modelos têm despertado considerável interesse do mercado, destacando o progresso acelerado da China em inteligência artificial. Seja pelos avanços do DeepSeek V4 na memória de longo prazo ou pelas melhorias do modelo MixFormer da Tencent na avaliação de tarefas do mundo real, ambos os esforços estão abordando fundamentalmente como futuros modelos de grande porte podem ser integrados de forma mais eficaz em ambientes de produção.
Artigo relacionado
A avaliação de US$ 5,3 bilhões da Runway desafia o Google, à medida que a IA de vídeo supera a de linguagem
Enquanto a maioria dos gigantes da IA investiu bilhões em modelos de linguagem, a startup de vídeo com IA generativa Runway segue em frente por um caminho bem diferente. De acordo com o TechCrunch, es
Google vai aumentar investimento na Anthropic; valor total pode chegar a US$ 40 bilhões
Na acirrada corrida pela IA, as principais empresas de tecnologia estão tomando medidas cada vez mais ousadas. De acordo com os últimos relatos, o Google planeja investir até US$ 10 bilhões na startup
Lançado o motor de xadrez de IA de código aberto e gratuito Maia 3 para aprimorar a experiência de jogo dos jogadores
A equipe do Maia Chess lançou um novo motor de xadrez de código aberto, o Maia 3, treinado com 250 milhões de partidas reais disputadas por humanos. Ele atinge uma classificação Elo de cerca de 1800 —
Recomendações de tópicos especiais relacionados
Comentários (0)

De acordo com uma reportagem exclusiva do BaiMing Lab, o tão aguardado DeepSeek V4 e o novo modelo MixFormer, de Yao Shunyu, têm lançamento oficial previsto para abril de 2026. O DeepSeek V4 é um grande modelo multimodal liderado por Liang Wenfeng. Após um extenso aperfeiçoamento, espera-se que ele alcance avanços significativos em proficiência de codificação e memória de longo prazo. Este lançamento está alinhado com a trajetória de pesquisa da equipe do DeepSeek nos últimos anos, particularmente no processamento de conteúdo visual e nos recursos de pesquisa impulsionados por IA.
A pesquisa de Liang Wenfeng concentra-se na exploração de mecanismos de “memória condicional”. Em janeiro de 2026, ele publicou um artigo intitulado “Conditional Memory via Scalable Lookup”, delineando as principais teorias. Além disso, em dezembro de 2025, ele divulgou outro estudo, “mHC: Manifold-Constrained Hyper-Connections”, que otimiza ainda mais a arquitetura subjacente. Esse trabalho visa abordar as limitações conhecidas dos modelos Transformer no que diz respeito à memória e à estabilidade do treinamento. O DeepSeek V4 não apenas possui um robusto poder de processamento multimodal, mas também está sendo profundamente otimizado para chips nacionais, com o objetivo de se tornar um modelo central totalmente dependente da infraestrutura de computação nacional.
Paralelamente, o novo modelo MixFormer de Yao Shunyu também está programado para ser lançado em abril. Desde dezembro de 2025, Yao atua como Cientista-Chefe de IA no Comitê Executivo da Tencent, ao mesmo tempo em que supervisiona os departamentos de Infraestrutura de IA e de grandes modelos de linguagem. Em fevereiro de 2026, ele apresentou o CL-bench, um novo benchmark de avaliação para “aprendizado contextual” que enfatiza o tratamento de contextos longos e a usabilidade do agente. Relatórios indicam que o novo modelo de Yao contará com cerca de 3 bilhões de parâmetros, com sua equipe priorizando a aplicação prática desde o início em vez da mera competição em escala de parâmetros.
Os lançamentos iminentes de ambos os modelos têm despertado considerável interesse do mercado, destacando o progresso acelerado da China em inteligência artificial. Seja pelos avanços do DeepSeek V4 na memória de longo prazo ou pelas melhorias do modelo MixFormer da Tencent na avaliação de tarefas do mundo real, ambos os esforços estão abordando fundamentalmente como futuros modelos de grande porte podem ser integrados de forma mais eficaz em ambientes de produção.
A avaliação de US$ 5,3 bilhões da Runway desafia o Google, à medida que a IA de vídeo supera a de linguagem
Enquanto a maioria dos gigantes da IA investiu bilhões em modelos de linguagem, a startup de vídeo com IA generativa Runway segue em frente por um caminho bem diferente. De acordo com o TechCrunch, es
Google vai aumentar investimento na Anthropic; valor total pode chegar a US$ 40 bilhões
Na acirrada corrida pela IA, as principais empresas de tecnologia estão tomando medidas cada vez mais ousadas. De acordo com os últimos relatos, o Google planeja investir até US$ 10 bilhões na startup





Lar






