O modelo compacto de IA da Samsung supera seus rivais maiores em raciocínio

Lar

Notícias

3 de Dezembro de 2025

BrianThomas

# ai # models # Samsung

Um novo artigo de um pesquisador de IA da Samsung descreve como uma rede compacta pode superar os grandes modelos de linguagem (LLMs) ao lidar com tarefas de raciocínio complexas.

Na corrida pelo domínio da IA, o mantra predominante do setor tem sido "maior é melhor". Enquanto os gigantes da tecnologia investem bilhões no desenvolvimento de modelos cada vez maiores, Alexia Jolicoeur-Martineau, da Samsung SAIL Montréal, propõe uma abordagem diferente e mais eficiente usando o Tiny Recursive Model (TRM).

Com apenas 7 milhões de parâmetros - menos de 0,01% do tamanho dos principais LLMs - o TRM alcança novos resultados de última geração em benchmarks notoriamente desafiadores, como o teste de inteligência ARC-AGI. As descobertas da Samsung desafiam a crença comum de que a escala é o único caminho para o avanço da IA, apresentando uma alternativa mais sustentável e eficiente em termos de parâmetros.

Superando os limites da escala

Embora os LLMs sejam excelentes na geração de textos semelhantes aos humanos, sua capacidade de lidar com raciocínios complexos e de várias etapas costuma ser frágil. Como eles geram respostas token a token, um erro no início pode comprometer toda a solução, resultando em uma resposta final incorreta.

Técnicas como a Chain-of-Thought, em que um modelo decompõe um problema passo a passo, visam a atenuar esse problema. No entanto, essas abordagens são computacionalmente caras, geralmente exigem dados de raciocínio substanciais e de alta qualidade e ainda podem produzir uma lógica falha. Mesmo com esses aprimoramentos, os LLMs têm dificuldade para resolver quebra-cabeças que exigem uma execução lógica impecável.

A pesquisa da Samsung se baseia no recente Modelo de Raciocínio Hierárquico (HRM). O HRM usou duas pequenas redes neurais que refinam recursivamente as respostas em diferentes frequências. Embora promissor, o modelo era complexo e dependia de argumentos biológicos incertos e teoremas de ponto fixo que nem sempre eram aplicáveis.

Em vez da estrutura de rede dupla do HRM, o TRM emprega uma única rede compacta que aprimora recursivamente o raciocínio interno e a resposta proposta.

O modelo recebe a pergunta, uma estimativa inicial de resposta e um recurso de raciocínio latente. Em seguida, ele passa por várias etapas para refinar seu raciocínio com base nas três entradas. Usando esse raciocínio aprimorado, ele atualiza sua previsão de resposta final. Todo esse processo pode se repetir até 16 vezes, permitindo que o modelo se autocorrija progressivamente de uma forma altamente eficiente em termos de parâmetros.

Contraintuitivamente, o estudo descobriu que uma rede de duas camadas generalizava muito melhor do que uma versão de quatro camadas. O projeto menor parece evitar o ajuste excessivo, um problema comum quando se treina com conjuntos de dados limitados e especializados.

O TRM também elimina as complexas suposições matemáticas de seu antecessor. O modelo HRM original tinha que assumir a convergência da função para um ponto fixo para justificar seu treinamento. O TRM contorna isso retropropagando por meio de seu processo de recursão completo - uma mudança que melhorou muito o desempenho, aumentando a precisão do benchmark Sudoku-Extreme de 56,5% para 87,4% nos testes de ablação.

O modelo da Samsung supera os benchmarks de IA com menos recursos

Os resultados são impressionantes. No conjunto de dados Sudoku-Extreme, que usa apenas 1.000 exemplos de treinamento, o TRM atinge 87,4% de precisão nos testes - um grande salto em relação aos 55% do HRM. No Maze-Hard, que envolve a navegação por caminhos longos através de labirintos de 30×30, a TRM obteve 85,3%, em comparação com os 74,5% da HRM.

Mais notavelmente, a TRM faz progressos significativos no Abstraction and Reasoning Corpus (ARC-AGI), um benchmark projetado para avaliar a verdadeira inteligência fluida em IA. Com apenas 7 milhões de parâmetros, a TRM atinge 44,6% de precisão no ARC-AGI-1 e 7,8% no ARC-AGI-2. Isso supera o HRM, que usou 27 milhões de parâmetros, e supera até mesmo muitos dos maiores LLMs do mundo. Para fins de comparação, o Gemini 2.5 Pro pontua apenas 4,9% no ARC-AGI-2.

O processo de treinamento do TRM também foi otimizado. Um mecanismo adaptativo chamado ACT - que determina quando o modelo melhorou suficientemente uma resposta para seguir em frente - foi simplificado, eliminando a necessidade de uma segunda passagem de avanço dispendiosa durante cada etapa de treinamento. Esse ajuste não prejudicou a generalização geral.

A pesquisa da Samsung oferece um forte contraponto à tendência de criar modelos de IA cada vez maiores. Ela demonstra que, ao projetar arquiteturas capazes de raciocínio iterativo e autocorreção, problemas extremamente difíceis podem ser resolvidos usando apenas uma pequena fração dos recursos computacionais.

Veja também: O novo agente de IA do Google reescreve códigos para automatizar correções de vulnerabilidades

Interessado em saber mais sobre IA e Big Data com os líderes do setor? Participe da AI & Big Data Expo em Amsterdã, Califórnia e Londres. Esse evento abrangente faz parte da TechEx e acontece junto com outros grandes eventos de tecnologia, como a Cyber Security Expo. Clique aqui para obter detalhes.

As notícias sobre IA são fornecidas pela TechForge Media. Descubra outros eventos de tecnologia empresarial e webinars futuros aqui.

Artigo relacionado

O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas O WordPress.com, a popular plataforma de hospedagem e publicação na web, está agora adotando agentes de IA — uma iniciativa que pode transformar a aparência e a experiência da web. A empresa anunciou

A Kakao Mobility apresenta o plano de ação para a direção autônoma de nível 4 com IA física A Kakao Mobility planeja desenvolver tecnologias de direção autônoma de nível 4 internamente, como parte de sua estratégia de IA física.Na conferência World IT Show 2026, realizada no COEX, em Seul,

Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima Barry Diller, o bilionário magnata da mídia, não acredita que Sam Altman, CEO da OpenAI, seja indigno de confiança, apesar de relatos recentes sugerirem o contrário. Em discurso na conferência “Future

Recomendações de tópicos especiais relacionados

Negócios

As melhores ferramentas de recrutamento com IA: analise currículos e automatize o agendamento de entrevistas com candidatos

Descubra as melhores ferramentas de recrutamento com IA de 2026 no XIX.AI. Nossa lista selecionada apresenta soluções poderosas e revolucionárias para a triagem de currículos e a automação do agendamento de entrevistas com candidatos. Compare opções gratuitas e pagas com testes práticos e rankings atualizados semanalmente. Encontre o seu assistente de contratação ideal e otimize seu processo de recrutamento hoje mesmo!

10 ferramentas

xix.ai

Produtividade

Treinadores de bem-estar e concentração com IA: controle o esgotamento e aumente os níveis de energia mental

Descubra os melhores coaches de bem-estar pessoal e concentração com IA de 2026 no XIX.AI. Nossos rankings selecionados apresentam ferramentas de ponta e revolucionárias para lidar com o esgotamento e aumentar a energia mental. Compare opções gratuitas e pagas com informações reais. Descubra hoje mesmo o caminho para atingir o máximo de produtividade e bem-estar.

10 ferramentas

xix.ai

chatbot

Os melhores chatbots românticos com IA: construa relacionamentos duradouros com personalidades consistentes

Descubra os melhores chatbots românticos com IA de 2026 para construir relacionamentos genuínos e duradouros. Nossa lista selecionada apresenta personalidades marcantes e consistentes, comparações entre versões gratuitas e pagas, além de testes práticos. Encontre seu companheiro ideal e comece a construir seu relacionamento hoje mesmo no XIX.AI.

10 ferramentas

xix.ai

Educação e Aprendizagem

Os melhores mentores em ciência de dados e inteligência artificial: domínio avançado em SQL, Pandas e fluxos de trabalho de aprendizado de máquina

Descubra os melhores mentores em ciência de dados com IA para 2026, que o ajudarão a dominar SQL, Pandas e fluxos de trabalho de aprendizado de máquina. Conheça nossa seleção cuidadosamente elaborada e altamente avaliada no XIX.AI para obter orientações poderosas e revolucionárias. Compare opções gratuitas e pagas com informações valiosas da prática real. Domine a ciência de dados hoje mesmo.

10 ferramentas

xix.ai

chatbot

Os melhores treinadores de paquera e conversação com IA: melhore seu carisma social e sua autoconfiança em tempo real

Descubra os melhores treinadores de conversação e paquera com IA de 2026 no XIX.AI. Nossa seleção cuidadosamente escolhida e com as melhores avaliações ajuda você a desenvolver carisma social e confiança em tempo real. Explore ferramentas imperdíveis e revolucionárias, com comparações entre versões gratuitas e pagas e rankings atualizados semanalmente. Descubra hoje mesmo o seu diferencial social.

10 ferramentas

xix.ai

código

Os melhores ferramentas de IA para testes unitários automatizados: geração de casos de teste Jest, PyTest e JUnit com apenas um clique

Descubra as mais recentes e bem avaliadas ferramentas de IA de 2026 para testes unitários automatizados. Nossa seleção cuidadosa inclui soluções poderosas que podem transformar o seu processo, permitindo gerar casos de teste para Jest, PyTest e JUnit de forma instantânea. Compare opções gratuitas e pagas com testes reais e classificações atualizadas semanalmente no XIX.AI. Desfrute das vantagens da IA e aumente a produtividade do seu desenvolvimento hoje mesmo.

10 ferramentas

xix.ai