opção
Lar
Notícias
Prévia do Hy3: Primeiro lançamento de código aberto após a reestruturação do Yuan, com maior praticidade e recursos de agente

Prévia do Hy3: Primeiro lançamento de código aberto após a reestruturação do Yuan, com maior praticidade e recursos de agente

1 de Junho de 2026
21

Em 23 de abril, a Huan Yuan, da Tencent, lançou o modelo de linguagem Hy3preview como uma versão de código aberto. Este modelo híbrido especializado combina raciocínio rápido e lento, com 295 bilhões de parâmetros no total e 21 bilhões de parâmetros ativados, suportando um comprimento de contexto de até 256K. É o primeiro modelo treinado após a reconstrução da Huan Yuan e o modelo mais inteligente da história da Huan Yuan, proporcionando ganhos substanciais em raciocínio complexo, seguimento de instruções, aprendizagem contextual, geração de código, capacidades de agente e desempenho geral de raciocínio.

Em fevereiro de 2026, a Tencent Huan Yuan reestruturou sua infraestrutura de pré-treinamento e aprendizado por reforço, além de estabelecer três princípios orientadores para alcançar utilidade prática:

1. Capacidades sistemáticas: em vez de enfatizar a especialização, reconhecemos que mesmo uma única aplicação, como um agente de código, requer profunda colaboração entre raciocínio, processamento de contexto longo, seguimento de instruções, diálogo, codificação e uso de ferramentas.

2. Avaliação autêntica: indo além de benchmarks públicos facilmente manipuláveis, avaliamos e aprimoramos a eficácia do modelo no mundo real usando perguntas desenvolvidas internamente, conjuntos de exames mais recentes, avaliação humana, testes coletivos específicos para produtos e outros métodos.

3. Foco na relação custo-benefício: a praticidade deve estar alinhada com a viabilidade comercial. A arquitetura do modelo e a estrutura de inferência, profundamente co-projetadas, reduzem substancialmente os custos das tarefas, tornando a IA acessível e eficaz.

O Hy3preview marca o início da busca acelerada da Huan Yuan por modelos de linguagem de grande porte práticos que resolvam problemas do mundo real.

Yao Shunyu, Cientista-Chefe de IA da Tencent, observou que o Hy3preview é o primeiro passo na reconstrução do modelo da Huan Yuan. Por meio deste lançamento de código aberto, esperamos receber feedback genuíno da comunidade e dos usuários, o que ajudará a refinar a praticidade da versão oficial do Hy3. Enquanto isso, continuamos ampliando o pré-treinamento e o aprendizado por reforço, elevando ainda mais o limite de inteligência do modelo. Por meio de um projeto conjunto profundo com vários produtos da Tencent, aprimoramos constantemente o desempenho do modelo no mundo real e começamos a explorar recursos especializados do modelo.

Atualmente, o Hy3preview está disponível no Tencent Cloud, Yua, ima, CodeBuddy, WorkBuddy, QQ, QQ Browser, Tencent Docs e Tencent LeXiang. Outros produtos importantes, como a Conta Oficial do WeChat, Peace Elite, Tencent News, Tencent Stock Selection, Tencent Customer Service e WeChat Reading, estão sendo implementados gradualmente. Além disso, o Hy3preview se integra a frameworks de agentes de código aberto populares, como OpenClaw, OpenCode e KiloCode, e está listado na plataforma de serviços de modelos de grande porte da Tencent Cloud, o TokenHub.

O Hy3preview enfatiza a praticidade em todos os aspectos, com um aumento substancial nas capacidades do agente

Várias avaliações confirmam que os recursos do Hy3preview passaram por melhorias abrangentes.

1.Excelentes capacidades de aprendizagem contextual e de seguir instruções

Em diversos cenários reais de produção e do dia a dia, analisar contextos confusos e extensos e seguir regras complexas e em constante evolução continua sendo um desafio fundamental para os modelos. Com base nos casos de uso de negócios da Tencent, Huan Yuan introduziu o CL-bench e o CL-bench-Life para avaliar de forma inovadora a aprendizagem contextual, aprimorando significativamente as habilidades de aprendizagem contextual e de seguir instruções do Hy3preview.

image.png

2. Capacidade excepcional de raciocínio complexo, alcançando a pontuação máxima no exame de qualificação para doutorado em matemática da Universidade de Tsinghua, na China

O raciocínio complexo sustenta a capacidade do modelo de lidar com problemas variados. O Hy3preview se destacou em benchmarks desafiadores de raciocínio STEM, como o FrontierScience-Olympiad e o IMOAnswerBench, e alcançou pontuações excepcionais no mais recente Exame de Qualificação para o Doutorado em Matemática da Academia Quzhen da Universidade de Tsinghua (primavera de 2026) e na Competição Nacional de Biologia do Ensino Médio (CHSBO2025), demonstrando um raciocínio generalizado robusto.

image.png

3. Grandes avanços nas capacidades de código e agente, demonstrando forte relação custo-benefício

As capacidades de código e de agente são as melhorias mais notáveis no Hy3preview. Graças à infraestrutura renovada de pré-treinamento e aprendizado por reforço e à escala ampliada das tarefas de RL, o Tencent Huan Yuan alcançou rapidamente pontuações competitivas em benchmarks líderes de agentes de código, como SWE-Bench Verified e Terminal-Bench2.0, bem como em benchmarks de agentes de busca, como BrowseComp e WideSearch.

image.png

No domínio digital, o código mede a capacidade do modelo de executar tarefas em ambientes de desenvolvimento, enquanto a pesquisa avalia sua capacidade de recuperar, filtrar e sintetizar informações de fontes abertas. Juntas, elas determinam se o modelo é genuinamente útil em cenários complexos de agentes, como o OpenClaw. O Hy3preview alcançou resultados sólidos em avaliações como ClawEval e WildClawBench, mostrando que as capacidades de nossos agentes estão progredindo de forma constante em direção à completude e à praticidade.

image.png

Além dos benchmarks públicos, a Tencent Huan Yuan construiu vários conjuntos de avaliação internos para medir o desempenho do modelo em contextos reais de desenvolvimento. Os resultados indicam que, no conjunto de tarefas de engenharia de back-end Hy-Backend, no Hy-Vibe Bench centrado no desenvolvedor e no desafiador conjunto de engenharia de software Hy-SWE Max, o Hy3preview exibiu forte competitividade.

48920987-bdbb-464b-adca-513891f742e1.png

Ao comparar o tamanho do modelo e o desempenho geral do agente entre alternativas de código aberto, o Hy3preview se destaca por sua alta relação custo-benefício.

image.png

Os principais negócios da Tencent estão totalmente integrados, e vários produtos-chave de IA apresentam benefícios claros

Antes de seu lançamento oficial, o Hy3preview foi testado nos principais produtos de IA da Tencent, gerando retornos positivos notáveis.

No que diz respeito ao Yua, o Huan Yuan e o Yua passaram por um profundo processo de co-design. O desempenho do modelo em métricas-chave, como precisão na compreensão de intenções, qualidade da geração de texto e pesquisa profunda, foi aprimorado, ao mesmo tempo em que foi ajustado para estilo de redação, expressão, inteligência emocional, estrutura de conteúdo e profissionalismo. Essa estreita colaboração entre modelo e produto proporcionou uma experiência de interação mais inteligente e semelhante à humana para os usuários.

Nos cenários de perguntas e respostas da base de conhecimento e de perguntas e respostas gerais do ima, os testes revelaram que o Hy3preview se destaca no processamento de textos longos, particularmente em tarefas de recuperação, nas quais alcança alta precisão, cobertura e abrangência nas respostas.

No CodeBuddy e no WorkBuddy, a latência do primeiro token do Hy3preview caiu 54%, a duração de ponta a ponta diminuiu 47% e a taxa de sucesso subiu para mais de 99,99%. Em ambientes reais de usuários, ele conduz de forma estável fluxos de trabalho complexos de agentes de até 495 etapas, abrangendo diversas tarefas de escritório, como processamento de documentos, análise de dados, recuperação de conhecimento e orquestração da cadeia de ferramentas MCP.

Em avaliações dedicadas ao avatar de IA e ao atendimento ao cliente por IA da Conta Oficial do WeChat, o Hy3preview apresentou melhorias mais abrangentes em relação ao Hy2. Ele demonstrou maior maturidade na compreensão da intenção do usuário, na continuidade de contextos complexos e na organização do conhecimento. Ao lidar com consultas ambíguas, frases curtas e diálogos de várias trocas, ele compreendeu melhor as necessidades do usuário e produziu respostas mais claras e estáveis. Ao integrar bases de conhecimento, memória do usuário e geração contextual, seus resultados se alinharam mais estreitamente com a função do avatar de IA ou do atendimento ao cliente, reduzindo significativamente a imaginação excessiva, suposições subjetivas e tom emocional — aproximando a interação geral de uma experiência “confiável, natural e eficiente”.

No cenário de NPC com IA do Peace Elite, a equipe integrou e avaliou rapidamente o Hy3preview após seu lançamento, com resultados gerais impressionantes. Para a interpretação de personagens fora do jogo, o Hy3preview compreendeu com precisão as configurações dos personagens e forneceu conteúdo altamente relevante e de valor agregado para perguntas abertas, criando uma conversa mais realista, natural e imersiva. Durante cenários complexos de batalha no jogo, o tempo de resposta do modelo parecia próximo ao de jogadores reais, demonstrando excelente estabilidade e habilidades de interpretação semelhantes às humanas — tornando seu desempenho geral excepcional.

No cenário de PPT com IA do Tencent Docs, em comparação com a versão anterior Hy2, o Hy3preview apresentou ganhos significativos: a taxa de sucesso na geração aumentou em 20%, as pontuações de avaliação melhoraram em 10% e o tempo de geração diminuiu em 20%. No geral, o novo modelo se destacou na seleção de modelos, combinação de cores, geração de esboços e complementação de conteúdo — livre de alucinações, tematicamente alinhado e com forte apelo visual.

Para o assistente de IA do QQ, Xiao Q, em comparação com a versão anterior, o Hy3preview trouxe otimizações importantes na latência do primeiro byte de textos longos, na velocidade geral de resposta e na eficiência de streaming. Recursos essenciais, como o raciocínio matemático, tiveram melhorias significativas, enquanto o cumprimento de instruções em múltiplos cenários e a generalização foram aprimorados ainda mais. No raciocínio de chamada de ferramentas e na resolução de referências em múltiplas trocas, ele apresentou um desempenho mais estável e eficiente. No teste oficial de cenário de agente inteligente do PinchBench QQ, realizado pela OpenClaw, ele alcançou resultados excepcionais, e a experiência geral do usuário melhorou significativamente.

A eficiência do raciocínio melhorou em 40%, proporcionando densidade de inteligência ideal pelo mesmo custo

Graças à profunda colaboração entre o modelo e a estrutura de inferência, juntamente com otimizações abrangentes na estrutura de inferência, desempenho do operador, algoritmos de quantização e muito mais, a eficiência geral do raciocínio melhorou em 40%, e o custo do Hy3preview caiu significativamente em relação à geração anterior.

Na plataforma de serviços de modelos de grande porte da Tencent Cloud, o TokenHub, o preço de entrada do Hy3preview é de apenas 1,2 yuan por milhão de tokens, o cache de entrada custa 0,4 yuan por milhão de tokens e a saída, 4 yuan por milhão de tokens. Além disso, a Tencent Cloud e a Huan Yuan lançaram em conjunto um pacote personalizado do Hy3preview Token Plan, com a edição pessoal a partir de 28 yuans por mês — oferecendo uma opção econômica para o desenvolvimento de agentes e a criação de aplicativos “Lobster”.

image.png

image.png

Artigo relacionado
A IA experimental da Anthropic, Claude, conclui negociações e transações em um teste de comércio eletrônico A IA experimental da Anthropic, Claude, conclui negociações e transações em um teste de comércio eletrônico À medida que a inteligência artificial avança rapidamente, a Anthropic lançou discretamente, na última sexta-feira, um experimento interno chamado “Projeto Deal”, demonstrando o potencial da IA no com
DeepSeek Code pronto para ser lançado DeepSeek Code pronto para ser lançado À medida que a tecnologia de IA avança, a DeepSeek encontra-se em um momento emocionante. A empresa de IA revelou recentemente que garantiu mais de 70 bilhões de yuans em financiamento. A direção enfa
O Grok de Musk: 1,5 trilhão de parâmetros e absorção de código de cursor — uma revolução ou um blefe? O Grok de Musk: 1,5 trilhão de parâmetros e absorção de código de cursor — uma revolução ou um blefe? Elon Musk finalmente está entrando em ação.Na corrida pela programação de IA, a OpenAI e a Anthropic estão acelerando, enquanto a xAI parece estar ficando para trás. Musk já declarou várias vezes seu
Recomendações de tópicos especiais relacionados
Negócios As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos
As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas
xix.ai
Produtividade Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental
Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas
xix.ai
chatbot Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes
Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas
xix.ai
Educação e Aprendizagem Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina
Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas
xix.ai
chatbot Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real
Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real

Descubra os melhores treinadores de conversação e paquera com IA de 2026 no XIX.AI. Nossa seleção cuidadosamente escolhida e com as melhores avaliações ajuda você a desenvolver carisma social e confiança em tempo real. Explore ferramentas imperdíveis e revolucionárias, com comparações entre versões gratuitas e pagas e rankings atualizados semanalmente. Descubra hoje mesmo o seu diferencial social.

10 ferramentas
xix.ai
código Os melhores ferramentas de IA para testes unitários automatizados: geração de casos de teste Jest, PyTest e JUnit com apenas um clique
Os melhores ferramentas de IA para testes unitários automatizados: geração de casos de teste Jest, PyTest e JUnit com apenas um clique

Descubra as mais recentes e bem avaliadas ferramentas de IA de 2026 para testes unitários automatizados. Nossa seleção cuidadosa inclui soluções poderosas que podem transformar o seu processo, permitindo gerar casos de teste para Jest, PyTest e JUnit de forma instantânea. Compare opções gratuitas e pagas com testes reais e classificações atualizadas semanalmente no XIX.AI. Desfrute das vantagens da IA e aumente a produtividade do seu desenvolvimento hoje mesmo.

10 ferramentas
xix.ai
Comentários (0)
0/500
OR