Lar
A Baidu lança o Ernie 5.1, reduzindo os custos de pré-treinamento em 94% e figurando entre os quatro primeiros do mundo
A Baidu lançou oficialmente seu modelo de linguagem de última geração, o Ernie 5.1, em 11 de maio de 2026. Com base no treinamento prévio do Ernie 5.0 lançado em janeiro — um modelo com 2,4 trilhões de parâmetros —, esta nova versão foi desenvolvida utilizando uma inovadora “estrutura de treinamento elástico de uma única etapa”. Essa abordagem permitiu ao Baidu otimizar vários tamanhos de modelo em um único ciclo de treinamento, reduzindo os custos de treinamento prévio do Ernie 5.1 para apenas 6% dos de modelos comparáveis.

Em 9 de maio, o Ernie 5.1 ocupava a quarta posição globalmente e o primeiro lugar entre os modelos chineses no ranking da Arena Search, com uma pontuação de 1.223 pontos, demonstrando sua eficiência excepcional e desempenho bem equilibrado.
Em termos de arquitetura, o Ernie 5.1 apresenta um design de submodelos com profundidade, largura e número de especialistas ativos ajustáveis. Sua contagem total de parâmetros é de apenas um terço da de seu antecessor, e o número de parâmetros efetivos ativados por consulta foi reduzido pela metade. Para lidar com o “efeito gangorra” comum no treinamento multihabilidades, a Baidu implementou um processo de pós-treinamento em quatro fases. Esse método utiliza código de treinamento especializado paralelo, inferência e modelos de especialistas proxy, combinados com destilação de estratégia e aprendizado por reforço, resolvendo efetivamente o desafio do setor de equilibrar a capacidade de programação com o raciocínio criativo. Além disso, uma infraestrutura de aprendizado por reforço renovada dissocia as atualizações do modelo, a geração de respostas e a avaliação. Quando combinada com uma biblioteca de computação de baixa precisão padronizada, isso aumenta significativamente a estabilidade do treinamento em grande escala.

Artigo relacionado
As receitas da Anthropic aumentam significativamente, e seu valor de mercado se aproxima dos 1 trilhão de dólares.
Relatórios indicam que a Anthropic alcançou um significativo crescimento nas receitas em apenas alguns meses. A receita anualizada da empresa agora excede os 30 bilhões de dólares – mais do que o triplo em relação ao valor no final do ano passado. Es
A Apple removeu o aplicativo Cal AI devido a compras dentro do aplicativo não autorizadas e cobranças manipuladoras.
A recent remoção da Cal AI pela Apple, um popular aplicativo de acompanhamento alimentar baseado em inteligência artificial dentro do MyFitnessPal, destaca a rigorosa aplicação das políticas da App Store relativas a pagamentos e assinaturas externas.
O sistema de cobrança baseado em tokens do Github Copilot provoca indignação entre os desenvolvedores.
A era de ouro do GitHub Copilot da Microsoft pode estar chegando ao fim, especialmente para os usuários individuais. A empresa está passando de um modelo de assinatura fixa para um sistema de cobrança baseado em tokens, o que pode aumentar significat
Recomendações de tópicos especiais relacionados
Comentários (0)
A Baidu lançou oficialmente seu modelo de linguagem de última geração, o Ernie 5.1, em 11 de maio de 2026. Com base no treinamento prévio do Ernie 5.0 lançado em janeiro — um modelo com 2,4 trilhões de parâmetros —, esta nova versão foi desenvolvida utilizando uma inovadora “estrutura de treinamento elástico de uma única etapa”. Essa abordagem permitiu ao Baidu otimizar vários tamanhos de modelo em um único ciclo de treinamento, reduzindo os custos de treinamento prévio do Ernie 5.1 para apenas 6% dos de modelos comparáveis.

Em 9 de maio, o Ernie 5.1 ocupava a quarta posição globalmente e o primeiro lugar entre os modelos chineses no ranking da Arena Search, com uma pontuação de 1.223 pontos, demonstrando sua eficiência excepcional e desempenho bem equilibrado.
Em termos de arquitetura, o Ernie 5.1 apresenta um design de submodelos com profundidade, largura e número de especialistas ativos ajustáveis. Sua contagem total de parâmetros é de apenas um terço da de seu antecessor, e o número de parâmetros efetivos ativados por consulta foi reduzido pela metade. Para lidar com o “efeito gangorra” comum no treinamento multihabilidades, a Baidu implementou um processo de pós-treinamento em quatro fases. Esse método utiliza código de treinamento especializado paralelo, inferência e modelos de especialistas proxy, combinados com destilação de estratégia e aprendizado por reforço, resolvendo efetivamente o desafio do setor de equilibrar a capacidade de programação com o raciocínio criativo. Além disso, uma infraestrutura de aprendizado por reforço renovada dissocia as atualizações do modelo, a geração de respostas e a avaliação. Quando combinada com uma biblioteca de computação de baixa precisão padronizada, isso aumenta significativamente a estabilidade do treinamento em grande escala.

As receitas da Anthropic aumentam significativamente, e seu valor de mercado se aproxima dos 1 trilhão de dólares.
Relatórios indicam que a Anthropic alcançou um significativo crescimento nas receitas em apenas alguns meses. A receita anualizada da empresa agora excede os 30 bilhões de dólares – mais do que o triplo em relação ao valor no final do ano passado. Es
A Apple removeu o aplicativo Cal AI devido a compras dentro do aplicativo não autorizadas e cobranças manipuladoras.
A recent remoção da Cal AI pela Apple, um popular aplicativo de acompanhamento alimentar baseado em inteligência artificial dentro do MyFitnessPal, destaca a rigorosa aplicação das políticas da App Store relativas a pagamentos e assinaturas externas.
O sistema de cobrança baseado em tokens do Github Copilot provoca indignação entre os desenvolvedores.
A era de ouro do GitHub Copilot da Microsoft pode estar chegando ao fim, especialmente para os usuários individuais. A empresa está passando de um modelo de assinatura fixa para um sistema de cobrança baseado em tokens, o que pode aumentar significat











