Lar
As habilidades de programação da DeepSeek V4 geram buzz online e discussões sobre tendências de estilo
Em 11 de fevereiro, a DeepSeek começou a lançar uma atualização gradual para suas plataformas web e de aplicativos móveis. Em 14 de fevereiro, a empresa anunciou oficialmente isso como um teste de sua nova arquitetura de modelo de texto longo. As interfaces web e de aplicativos atualizadas agora lidam com contextos ultralongos de até 1 milhão de tokens, com a base de conhecimento atualizada para incluir informações até maio de 2025. No entanto, o serviço API permanece na versão V3.2, que ainda suporta apenas 128K de contexto. Especialistas do setor veem essa atualização como um aquecimento técnico e um teste de estresse antes do lançamento de seu modelo V4 de última geração. Consequentemente, a expectativa online está crescendo em plataformas como o Weibo para o próximo lançamento do V4.

Após a atualização, o estilo de interação do DeepSeek mudou visivelmente, levando os usuários a comentarem que ele “se tornou menos simpático”. Esse assunto rapidamente chegou ao topo da lista de tendências do Weibo, acumulando mais de 68,535 milhões de visualizações. As mudanças específicas incluem o fato de o modelo não usar mais apelidos personalizados para os usuários, passando a se dirigir a todos uniformemente como “usuário”. No modo de pensamento profundo, as respostas se tornaram mais curtas e diretas, adotando um tom direto e conciso. Algumas respostas foram até mesmo percebidas como “ambíguas no tom” ou “sarcásticas”, deixando os usuários acostumados com seu estilo empático anterior com uma sensação de rejeição. As reações dos internautas foram divididas: fãs emocionados sentiram falta das interações calorosas anteriores, enquanto usuários preocupados com a eficiência elogiaram a comunicação racional e simplificada, vendo-a como a marca registrada de uma verdadeira ferramenta de produtividade. Notavelmente, o modelo atualizado passou com sucesso no “teste de Turing da lavagem de carros”, um desafio que muitas vezes atrapalha os principais modelos de IA.
Em relação à mudança de estilo, o comunicado oficial da DeepSeek esclareceu que não se tratava de uma mudança intencional, mas um subproduto da priorização da eficiência e do refinamento dos limites de resposta. Expressões excessivas e conteúdo de preenchimento poderiam diluir a densidade das informações em consultas complexas, e a atualização também atendeu aos usuários que preferem respostas claras, sem o que consideram “IA fingindo se importar”. Esse desenvolvimento alimentou ainda mais o entusiasmo online pelo DeepSeek V4. Relatórios sugerem que o modelo está programado para ser lançado por volta do Festival da Primavera, em meados de fevereiro de 2026, possivelmente em ou perto de 17 de fevereiro, de acordo com fontes do Weibo.
Como um modelo emblemático com trilhões de parâmetros, o V4 dá grande ênfase às melhorias de programação. Os primeiros benchmarks internos indicam que o V4 já superou modelos líderes como Claude e GPT em tarefas de programação, posicionando-o para potencialmente remodelar o cenário da programação de IA. Além disso, o V4 introduz vários avanços tecnológicos importantes, permitindo processar e interpretar prompts de código extremamente longos e compreender grandes contextos de código em uma única passagem — uma vantagem significativa para o desenvolvimento em nível empresarial. Algoritmos de treinamento atualizados aprimoram sua capacidade de reconhecer padrões de dados e reduzir a degradação do desempenho. O raciocínio do modelo é mais rigoroso e confiável, alcançando um desempenho estável sem regressão, ao mesmo tempo em que alcança um melhor equilíbrio entre vários recursos.
Ao mesmo tempo, o modelo manterá sua vantagem de contexto de um milhão de tokens, com custos de inferência significativamente mais baixos do que os dos concorrentes ocidentais. Também está programado para ser disponibilizado como código aberto sob a licença Apache 2.0.
Artigo relacionado
A Snowflake investe mais de US$ 600 milhões em chips personalizados da AWS para impulsionar a IA empresarial
A Snowflake, gigante do setor de dados em nuvem, anunciou planos de investir mais de US$ 600 milhões nos próximos seis anos para adquirir CPUs da série Graviton e aceleradores de IA desenvolvidos pela
A China Telecom investe na Mianbi Intelligence e aumenta o capital para 713.000 yuans para LLM e infraestrutura de dados
A “seleção nacional” e a figura de destaque da Universidade de Tsinghua no setor de modelos de grande escala estão aprofundando seu alinhamento estratégico. Em 1º de março de 2026, de acordo com os da
O Grupo Taotian acelera a reestruturação voltada para a IA e concede cotas de tokens gratuitas aos estagiários
O Grupo TaoTian lançou recentemente o “Plano de Produtividade em IA”, concebido para acelerar a integração da tecnologia de IA nas operações de comércio eletrônico e nos fluxos de trabalho de P&D por
Recomendações de tópicos especiais relacionados
Comentários (0)
Em 11 de fevereiro, a DeepSeek começou a lançar uma atualização gradual para suas plataformas web e de aplicativos móveis. Em 14 de fevereiro, a empresa anunciou oficialmente isso como um teste de sua nova arquitetura de modelo de texto longo. As interfaces web e de aplicativos atualizadas agora lidam com contextos ultralongos de até 1 milhão de tokens, com a base de conhecimento atualizada para incluir informações até maio de 2025. No entanto, o serviço API permanece na versão V3.2, que ainda suporta apenas 128K de contexto. Especialistas do setor veem essa atualização como um aquecimento técnico e um teste de estresse antes do lançamento de seu modelo V4 de última geração. Consequentemente, a expectativa online está crescendo em plataformas como o Weibo para o próximo lançamento do V4.

Após a atualização, o estilo de interação do DeepSeek mudou visivelmente, levando os usuários a comentarem que ele “se tornou menos simpático”. Esse assunto rapidamente chegou ao topo da lista de tendências do Weibo, acumulando mais de 68,535 milhões de visualizações. As mudanças específicas incluem o fato de o modelo não usar mais apelidos personalizados para os usuários, passando a se dirigir a todos uniformemente como “usuário”. No modo de pensamento profundo, as respostas se tornaram mais curtas e diretas, adotando um tom direto e conciso. Algumas respostas foram até mesmo percebidas como “ambíguas no tom” ou “sarcásticas”, deixando os usuários acostumados com seu estilo empático anterior com uma sensação de rejeição. As reações dos internautas foram divididas: fãs emocionados sentiram falta das interações calorosas anteriores, enquanto usuários preocupados com a eficiência elogiaram a comunicação racional e simplificada, vendo-a como a marca registrada de uma verdadeira ferramenta de produtividade. Notavelmente, o modelo atualizado passou com sucesso no “teste de Turing da lavagem de carros”, um desafio que muitas vezes atrapalha os principais modelos de IA.
Em relação à mudança de estilo, o comunicado oficial da DeepSeek esclareceu que não se tratava de uma mudança intencional, mas um subproduto da priorização da eficiência e do refinamento dos limites de resposta. Expressões excessivas e conteúdo de preenchimento poderiam diluir a densidade das informações em consultas complexas, e a atualização também atendeu aos usuários que preferem respostas claras, sem o que consideram “IA fingindo se importar”. Esse desenvolvimento alimentou ainda mais o entusiasmo online pelo DeepSeek V4. Relatórios sugerem que o modelo está programado para ser lançado por volta do Festival da Primavera, em meados de fevereiro de 2026, possivelmente em ou perto de 17 de fevereiro, de acordo com fontes do Weibo.
Como um modelo emblemático com trilhões de parâmetros, o V4 dá grande ênfase às melhorias de programação. Os primeiros benchmarks internos indicam que o V4 já superou modelos líderes como Claude e GPT em tarefas de programação, posicionando-o para potencialmente remodelar o cenário da programação de IA. Além disso, o V4 introduz vários avanços tecnológicos importantes, permitindo processar e interpretar prompts de código extremamente longos e compreender grandes contextos de código em uma única passagem — uma vantagem significativa para o desenvolvimento em nível empresarial. Algoritmos de treinamento atualizados aprimoram sua capacidade de reconhecer padrões de dados e reduzir a degradação do desempenho. O raciocínio do modelo é mais rigoroso e confiável, alcançando um desempenho estável sem regressão, ao mesmo tempo em que alcança um melhor equilíbrio entre vários recursos.
Ao mesmo tempo, o modelo manterá sua vantagem de contexto de um milhão de tokens, com custos de inferência significativamente mais baixos do que os dos concorrentes ocidentais. Também está programado para ser disponibilizado como código aberto sob a licença Apache 2.0.
A Snowflake investe mais de US$ 600 milhões em chips personalizados da AWS para impulsionar a IA empresarial
A Snowflake, gigante do setor de dados em nuvem, anunciou planos de investir mais de US$ 600 milhões nos próximos seis anos para adquirir CPUs da série Graviton e aceleradores de IA desenvolvidos pela
A China Telecom investe na Mianbi Intelligence e aumenta o capital para 713.000 yuans para LLM e infraestrutura de dados
A “seleção nacional” e a figura de destaque da Universidade de Tsinghua no setor de modelos de grande escala estão aprofundando seu alinhamento estratégico. Em 1º de março de 2026, de acordo com os da
O Grupo Taotian acelera a reestruturação voltada para a IA e concede cotas de tokens gratuitas aos estagiários
O Grupo TaoTian lançou recentemente o “Plano de Produtividade em IA”, concebido para acelerar a integração da tecnologia de IA nas operações de comércio eletrônico e nos fluxos de trabalho de P&D por











