opção
Lar
Notícias
Estudo da Microsoft revela que mais tokens de IA aumentam os erros de raciocínio

Estudo da Microsoft revela que mais tokens de IA aumentam os erros de raciocínio

29 de Setembro de 2025
78

Insights emergentes sobre a eficiência do raciocínio do LLM

Uma nova pesquisa da Microsoft demonstra que as técnicas avançadas de raciocínio em modelos de linguagem grandes não produzem melhorias uniformes em diferentes sistemas de IA. Seu estudo inovador analisou como nove modelos de base líderes responderam a várias abordagens de dimensionamento durante a inferência.

Avaliação dos métodos de dimensionamento do tempo de inferência

A equipe de pesquisa implementou uma metodologia de teste rigorosa em três técnicas de escalonamento distintas:

  • Solicitação tradicional de cadeia de raciocínio
  • Geração paralela de respostas com agregação
  • Refinamento sequencial por meio de loops de feedback
Estrutura experimental para avaliar o desempenho do raciocínio

Oito benchmarks abrangentes forneceram cenários de teste desafiadores em várias disciplinas, incluindo matemática, raciocínio científico, solução de problemas complexos e análise espacial. Várias avaliações apresentaram níveis de dificuldade graduados para examinar como o desempenho se adapta à complexidade do problema.

Principais descobertas sobre o desempenho de raciocínio

A avaliação abrangente produziu várias percepções importantes para os profissionais de IA:

  • Os ganhos de desempenho das técnicas de escalonamento variam drasticamente de acordo com a arquitetura do modelo e o domínio da tarefa
  • Respostas mais longas não se correlacionam consistentemente com soluções melhores
  • Os custos de computação flutuam de forma imprevisível, mesmo para consultas idênticas
  • Os modelos tradicionais podem, às vezes, corresponder a modelos de raciocínio especializados por meio de escalonamento extensivo
  • Os mecanismos de verificação são promissores para aumentar a eficiência
Desempenho versus custo computacional entre modelos e tarefas

Implicações práticas para o desenvolvimento de IA

Essas descobertas têm implicações significativas para a implementação da IA empresarial:

A previsibilidade de custos surge como um grande desafio, com o uso de tokens mostrando alta variação mesmo para respostas corretas. "Os desenvolvedores precisam de modelos com padrões de computação consistentes", observa a pesquisadora da Microsoft Besmira Nushi.

A pesquisa também identifica o comprimento da resposta como um indicador em potencial da confiança do modelo, com respostas excessivamente longas, muitas vezes sinalizando soluções incorretas além de certos limites.

Padrões de escala de inferência no desempenho do GPT-4o

O futuro dos sistemas de raciocínio eficientes

O estudo destaca várias direções promissoras para o desenvolvimento futuro:

"Os mecanismos de verificação podem transformar a forma como abordamos os problemas de raciocínio", explica Nushi, sugerindo que os sistemas de validação empresarial existentes podem ser adaptados para aplicativos de IA. Essa integração permitiria que as interfaces de linguagem natural aproveitassem a lógica de validação especializada.

A pesquisa ressalta a necessidade crescente de soluções que equilibrem a precisão do raciocínio com custos computacionais previsíveis à medida que os sistemas de IA assumem tarefas cada vez mais complexas no mundo real.

Artigo relacionado
O Google integra IA autônoma e widgets com codificação de ambiente no Android O Google integra IA autônoma e widgets com codificação de ambiente no Android O Google anunciou um novo conjunto de recursos de IA sob a marca Gemini Intelligence durante o evento “Android Show: I/O Edition”, na terça-feira. Esses recursos incluem a capacidade da IA de realizar
O modelo de IA da Meta se destaca, mas a identidade de código aberto se desgasta O modelo de IA da Meta se destaca, mas a identidade de código aberto se desgasta O cenário da IA de código aberto sempre ofereceu muitas opções. Durante anos, os desenvolvedores puderam acessar modelos como o Mistral, o Falcon e um número crescente de alternativas de código aberto
Pai processa o Google e culpa o chatbot Gemini pela ilusão fatal que levou à morte do filho Pai processa o Google e culpa o chatbot Gemini pela ilusão fatal que levou à morte do filho Jonathan Gavalas, de 36 anos, começou a usar o chatbot de IA Gemini, do Google, em agosto de 2025 para obter assistência em compras, ajuda na redação de textos e planejamento de viagens. Em 2 de outub
Recomendações de tópicos especiais relacionados
Produtividade Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental
Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas
xix.ai
chatbot Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes
Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas
xix.ai
Educação e Aprendizagem Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina
Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas
xix.ai
chatbot Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real
Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real

Descubra os melhores treinadores de conversação e paquera com IA de 2026 no XIX.AI. Nossa seleção cuidadosamente escolhida e com as melhores avaliações ajuda você a desenvolver carisma social e confiança em tempo real. Explore ferramentas imperdíveis e revolucionárias, com comparações entre versões gratuitas e pagas e rankings atualizados semanalmente. Descubra hoje mesmo o seu diferencial social.

10 ferramentas
xix.ai
código Os melhores ferramentas de IA para testes unitários automatizados: geração de casos de teste Jest, PyTest e JUnit com apenas um clique
Os melhores ferramentas de IA para testes unitários automatizados: geração de casos de teste Jest, PyTest e JUnit com apenas um clique

Descubra as mais recentes e bem avaliadas ferramentas de IA de 2026 para testes unitários automatizados. Nossa seleção cuidadosa inclui soluções poderosas que podem transformar o seu processo, permitindo gerar casos de teste para Jest, PyTest e JUnit de forma instantânea. Compare opções gratuitas e pagas com testes reais e classificações atualizadas semanalmente no XIX.AI. Desfrute das vantagens da IA e aumente a produtividade do seu desenvolvimento hoje mesmo.

10 ferramentas
xix.ai
Análise de dados As melhores ferramentas de visualização de dados com IA: gere automaticamente painéis interativos de BI a partir de arquivos brutos
As melhores ferramentas de visualização de dados com IA: gere automaticamente painéis interativos de BI a partir de arquivos brutos

Descubra as melhores ferramentas de visualização de dados com IA de 2026 no XIX.AI. Nossa seleção cuidadosamente escolhida e com as melhores avaliações ajuda você a gerar automaticamente painéis de BI poderosos e interativos a partir de arquivos brutos, de forma instantânea. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Liberte o potencial dos seus dados hoje mesmo.

10 ferramentas
xix.ai
Comentários (1)
0/500
JerryGonzález
JerryGonzález 3 de Fevereiro de 2026 à33 20:02:33 WET

この記事には正直驚いたよ!トークン数を増やすほど推論エラーが増えるって…逆に直観に反する結果だね。🤔それってAIをどんどん複雑にする今のトレンドに警鐘を鳴らしてる気がする。コスト増でも性能アップすると思ってたけど、単純に大きければ良いわけじゃないんだ。こんな研究が続けば、AIの最適化って意外とシンプルな方向に行くかも?

OR