O modelo compacto de IA da Samsung supera seus rivais maiores em raciocínio
Um novo artigo de um pesquisador de IA da Samsung descreve como uma rede compacta pode superar os grandes modelos de linguagem (LLMs) ao lidar com tarefas de raciocínio complexas.
Na corrida pelo domínio da IA, o mantra predominante do setor tem sido "maior é melhor". Enquanto os gigantes da tecnologia investem bilhões no desenvolvimento de modelos cada vez maiores, Alexia Jolicoeur-Martineau, da Samsung SAIL Montréal, propõe uma abordagem diferente e mais eficiente usando o Tiny Recursive Model (TRM).
Com apenas 7 milhões de parâmetros - menos de 0,01% do tamanho dos principais LLMs - o TRM alcança novos resultados de última geração em benchmarks notoriamente desafiadores, como o teste de inteligência ARC-AGI. As descobertas da Samsung desafiam a crença comum de que a escala é o único caminho para o avanço da IA, apresentando uma alternativa mais sustentável e eficiente em termos de parâmetros.
Superando os limites da escala
Embora os LLMs sejam excelentes na geração de textos semelhantes aos humanos, sua capacidade de lidar com raciocínios complexos e de várias etapas costuma ser frágil. Como eles geram respostas token a token, um erro no início pode comprometer toda a solução, resultando em uma resposta final incorreta.
Técnicas como a Chain-of-Thought, em que um modelo decompõe um problema passo a passo, visam a atenuar esse problema. No entanto, essas abordagens são computacionalmente caras, geralmente exigem dados de raciocínio substanciais e de alta qualidade e ainda podem produzir uma lógica falha. Mesmo com esses aprimoramentos, os LLMs têm dificuldade para resolver quebra-cabeças que exigem uma execução lógica impecável.
A pesquisa da Samsung se baseia no recente Modelo de Raciocínio Hierárquico (HRM). O HRM usou duas pequenas redes neurais que refinam recursivamente as respostas em diferentes frequências. Embora promissor, o modelo era complexo e dependia de argumentos biológicos incertos e teoremas de ponto fixo que nem sempre eram aplicáveis.
Em vez da estrutura de rede dupla do HRM, o TRM emprega uma única rede compacta que aprimora recursivamente o raciocínio interno e a resposta proposta.
O modelo recebe a pergunta, uma estimativa inicial de resposta e um recurso de raciocínio latente. Em seguida, ele passa por várias etapas para refinar seu raciocínio com base nas três entradas. Usando esse raciocínio aprimorado, ele atualiza sua previsão de resposta final. Todo esse processo pode se repetir até 16 vezes, permitindo que o modelo se autocorrija progressivamente de uma forma altamente eficiente em termos de parâmetros.
Contraintuitivamente, o estudo descobriu que uma rede de duas camadas generalizava muito melhor do que uma versão de quatro camadas. O projeto menor parece evitar o ajuste excessivo, um problema comum quando se treina com conjuntos de dados limitados e especializados.
O TRM também elimina as complexas suposições matemáticas de seu antecessor. O modelo HRM original tinha que assumir a convergência da função para um ponto fixo para justificar seu treinamento. O TRM contorna isso retropropagando por meio de seu processo de recursão completo - uma mudança que melhorou muito o desempenho, aumentando a precisão do benchmark Sudoku-Extreme de 56,5% para 87,4% nos testes de ablação.
O modelo da Samsung supera os benchmarks de IA com menos recursos
Os resultados são impressionantes. No conjunto de dados Sudoku-Extreme, que usa apenas 1.000 exemplos de treinamento, o TRM atinge 87,4% de precisão nos testes - um grande salto em relação aos 55% do HRM. No Maze-Hard, que envolve a navegação por caminhos longos através de labirintos de 30×30, a TRM obteve 85,3%, em comparação com os 74,5% da HRM.
Mais notavelmente, a TRM faz progressos significativos no Abstraction and Reasoning Corpus (ARC-AGI), um benchmark projetado para avaliar a verdadeira inteligência fluida em IA. Com apenas 7 milhões de parâmetros, a TRM atinge 44,6% de precisão no ARC-AGI-1 e 7,8% no ARC-AGI-2. Isso supera o HRM, que usou 27 milhões de parâmetros, e supera até mesmo muitos dos maiores LLMs do mundo. Para fins de comparação, o Gemini 2.5 Pro pontua apenas 4,9% no ARC-AGI-2.
O processo de treinamento do TRM também foi otimizado. Um mecanismo adaptativo chamado ACT - que determina quando o modelo melhorou suficientemente uma resposta para seguir em frente - foi simplificado, eliminando a necessidade de uma segunda passagem de avanço dispendiosa durante cada etapa de treinamento. Esse ajuste não prejudicou a generalização geral.
A pesquisa da Samsung oferece um forte contraponto à tendência de criar modelos de IA cada vez maiores. Ela demonstra que, ao projetar arquiteturas capazes de raciocínio iterativo e autocorreção, problemas extremamente difíceis podem ser resolvidos usando apenas uma pequena fração dos recursos computacionais.
Veja também: O novo agente de IA do Google reescreve códigos para automatizar correções de vulnerabilidades

Interessado em saber mais sobre IA e Big Data com os líderes do setor? Participe da AI & Big Data Expo em Amsterdã, Califórnia e Londres. Esse evento abrangente faz parte da TechEx e acontece junto com outros grandes eventos de tecnologia, como a Cyber Security Expo. Clique aqui para obter detalhes.
As notícias sobre IA são fornecidas pela TechForge Media. Descubra outros eventos de tecnologia empresarial e webinars futuros aqui.
Artigo relacionado
O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas
O WordPress.com, a popular plataforma de hospedagem e publicação na web, está agora adotando agentes de IA — uma iniciativa que pode transformar a aparência e a experiência da web. A empresa anunciou
A Kakao Mobility apresenta o plano de ação para a direção autônoma de nível 4 com IA física
A Kakao Mobility planeja desenvolver tecnologias de direção autônoma de nível 4 internamente, como parte de sua estratégia de IA física.Na conferência World IT Show 2026, realizada no COEX, em Seul,
Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima
Barry Diller, o bilionário magnata da mídia, não acredita que Sam Altman, CEO da OpenAI, seja indigno de confiança, apesar de relatos recentes sugerirem o contrário. Em discurso na conferência “Future
Recomendações de tópicos especiais relacionados
Comentários (0)
Um novo artigo de um pesquisador de IA da Samsung descreve como uma rede compacta pode superar os grandes modelos de linguagem (LLMs) ao lidar com tarefas de raciocínio complexas.
Na corrida pelo domínio da IA, o mantra predominante do setor tem sido "maior é melhor". Enquanto os gigantes da tecnologia investem bilhões no desenvolvimento de modelos cada vez maiores, Alexia Jolicoeur-Martineau, da Samsung SAIL Montréal, propõe uma abordagem diferente e mais eficiente usando o Tiny Recursive Model (TRM).
Com apenas 7 milhões de parâmetros - menos de 0,01% do tamanho dos principais LLMs - o TRM alcança novos resultados de última geração em benchmarks notoriamente desafiadores, como o teste de inteligência ARC-AGI. As descobertas da Samsung desafiam a crença comum de que a escala é o único caminho para o avanço da IA, apresentando uma alternativa mais sustentável e eficiente em termos de parâmetros.
Superando os limites da escala
Embora os LLMs sejam excelentes na geração de textos semelhantes aos humanos, sua capacidade de lidar com raciocínios complexos e de várias etapas costuma ser frágil. Como eles geram respostas token a token, um erro no início pode comprometer toda a solução, resultando em uma resposta final incorreta.
Técnicas como a Chain-of-Thought, em que um modelo decompõe um problema passo a passo, visam a atenuar esse problema. No entanto, essas abordagens são computacionalmente caras, geralmente exigem dados de raciocínio substanciais e de alta qualidade e ainda podem produzir uma lógica falha. Mesmo com esses aprimoramentos, os LLMs têm dificuldade para resolver quebra-cabeças que exigem uma execução lógica impecável.
A pesquisa da Samsung se baseia no recente Modelo de Raciocínio Hierárquico (HRM). O HRM usou duas pequenas redes neurais que refinam recursivamente as respostas em diferentes frequências. Embora promissor, o modelo era complexo e dependia de argumentos biológicos incertos e teoremas de ponto fixo que nem sempre eram aplicáveis.
Em vez da estrutura de rede dupla do HRM, o TRM emprega uma única rede compacta que aprimora recursivamente o raciocínio interno e a resposta proposta.
O modelo recebe a pergunta, uma estimativa inicial de resposta e um recurso de raciocínio latente. Em seguida, ele passa por várias etapas para refinar seu raciocínio com base nas três entradas. Usando esse raciocínio aprimorado, ele atualiza sua previsão de resposta final. Todo esse processo pode se repetir até 16 vezes, permitindo que o modelo se autocorrija progressivamente de uma forma altamente eficiente em termos de parâmetros.
Contraintuitivamente, o estudo descobriu que uma rede de duas camadas generalizava muito melhor do que uma versão de quatro camadas. O projeto menor parece evitar o ajuste excessivo, um problema comum quando se treina com conjuntos de dados limitados e especializados.
O TRM também elimina as complexas suposições matemáticas de seu antecessor. O modelo HRM original tinha que assumir a convergência da função para um ponto fixo para justificar seu treinamento. O TRM contorna isso retropropagando por meio de seu processo de recursão completo - uma mudança que melhorou muito o desempenho, aumentando a precisão do benchmark Sudoku-Extreme de 56,5% para 87,4% nos testes de ablação.
O modelo da Samsung supera os benchmarks de IA com menos recursos
Os resultados são impressionantes. No conjunto de dados Sudoku-Extreme, que usa apenas 1.000 exemplos de treinamento, o TRM atinge 87,4% de precisão nos testes - um grande salto em relação aos 55% do HRM. No Maze-Hard, que envolve a navegação por caminhos longos através de labirintos de 30×30, a TRM obteve 85,3%, em comparação com os 74,5% da HRM.
Mais notavelmente, a TRM faz progressos significativos no Abstraction and Reasoning Corpus (ARC-AGI), um benchmark projetado para avaliar a verdadeira inteligência fluida em IA. Com apenas 7 milhões de parâmetros, a TRM atinge 44,6% de precisão no ARC-AGI-1 e 7,8% no ARC-AGI-2. Isso supera o HRM, que usou 27 milhões de parâmetros, e supera até mesmo muitos dos maiores LLMs do mundo. Para fins de comparação, o Gemini 2.5 Pro pontua apenas 4,9% no ARC-AGI-2.
O processo de treinamento do TRM também foi otimizado. Um mecanismo adaptativo chamado ACT - que determina quando o modelo melhorou suficientemente uma resposta para seguir em frente - foi simplificado, eliminando a necessidade de uma segunda passagem de avanço dispendiosa durante cada etapa de treinamento. Esse ajuste não prejudicou a generalização geral.
A pesquisa da Samsung oferece um forte contraponto à tendência de criar modelos de IA cada vez maiores. Ela demonstra que, ao projetar arquiteturas capazes de raciocínio iterativo e autocorreção, problemas extremamente difíceis podem ser resolvidos usando apenas uma pequena fração dos recursos computacionais.
Veja também: O novo agente de IA do Google reescreve códigos para automatizar correções de vulnerabilidades

Interessado em saber mais sobre IA e Big Data com os líderes do setor? Participe da AI & Big Data Expo em Amsterdã, Califórnia e Londres. Esse evento abrangente faz parte da TechEx e acontece junto com outros grandes eventos de tecnologia, como a Cyber Security Expo. Clique aqui para obter detalhes.
As notícias sobre IA são fornecidas pela TechForge Media. Descubra outros eventos de tecnologia empresarial e webinars futuros aqui.
O WordPress.com agora permite que agentes de IA escrevam e publiquem posts, entre outras coisas
O WordPress.com, a popular plataforma de hospedagem e publicação na web, está agora adotando agentes de IA — uma iniciativa que pode transformar a aparência e a experiência da web. A empresa anunciou
Barry Diller: A confiança em Sam Altman é irrelevante à medida que a IA geral se aproxima
Barry Diller, o bilionário magnata da mídia, não acredita que Sam Altman, CEO da OpenAI, seja indigno de confiança, apesar de relatos recentes sugerirem o contrário. Em discurso na conferência “Future





Lar






