opção
Lar
Notícias
MIT revela estrutura de IA de autoaprendizagem que vai além dos modelos estáticos

MIT revela estrutura de IA de autoaprendizagem que vai além dos modelos estáticos

14 de Outubro de 2025
3

Pesquisadores do MIT são pioneiros na estrutura de IA de autoaprendizagem

Uma equipe do MIT desenvolveu um sistema inovador chamado SEAL (Self-Adapting Language Models) que permite que grandes modelos de linguagem evoluam autonomamente seus recursos. Esse avanço permite que os sistemas de IA gerem seus próprios materiais de treinamento e protocolos de aprendizagem, possibilitando a integração permanente de novos conhecimentos e habilidades.

O SEAL representa um avanço significativo para aplicativos corporativos de IA, especialmente para agentes inteligentes que operam em ambientes fluidos em que a adaptação contínua é crucial. A estrutura aborda uma limitação fundamental da tecnologia LLM atual: o desafio da integração permanente do conhecimento além do aprendizado contextual temporário.

O desafio da adaptação na IA moderna

Embora os grandes modelos de linguagem demonstrem recursos impressionantes, sua capacidade de realmente aprender e internalizar novas informações continua limitada. Os métodos de adaptação atuais, como o ajuste fino ou a aprendizagem no contexto, tratam os dados de entrada de forma passiva, sem otimizá-los para os processos de aprendizagem do modelo.

"Os aplicativos empresariais exigem mais do que a recuperação temporária do conhecimento - eles precisam de uma adaptação profunda e duradoura", explicou Jyo Pari, candidato a PhD do MIT e coautor do artigo. "Seja um assistente de codificação que domina estruturas proprietárias ou uma IA de atendimento ao cliente que aprende as preferências do usuário, esse conhecimento deve ser incorporado à arquitetura principal do modelo."

A arquitetura do SEAL

Visão geral da estrutura do SEAL (Fonte: arXiv)

A estrutura SEAL apresenta uma nova abordagem de aprendizagem por reforço em que os modelos geram "autoedições" - instruções especializadas para atualizar seus próprios parâmetros. Essas edições podem reestruturar informações, criar exemplos de treinamento sintéticos ou até mesmo definir protocolos de aprendizado, permitindo que o modelo crie seu próprio currículo.

O sistema opera por meio de ciclos duplos de aprendizado:

  • Loop interno: Executa atualizações temporárias de peso com base em edições autogeradas
  • Loop externo: Avalia a eficácia da atualização e reforça as estratégias bem-sucedidas

Esse mecanismo de autoaperfeiçoamento contínuo combina geração de dados sintéticos, aprendizagem por reforço e treinamento em tempo de teste em um paradigma de aprendizagem coeso.

Desempenho comprovado em todos os domínios

Integração do conhecimento

Resultados da integração de conhecimento do SEAL (Fonte: arXiv)

Nos testes de retenção de conhecimento, os modelos aprimorados pelo SEAL demonstraram 47% de precisão na recuperação do conteúdo da passagem sem acesso ao material de origem, superando significativamente o ajuste fino da linha de base e os dados sintéticos gerados pelo GPT-4.1.

Aprendizado de poucas tentativas

Desempenho do aprendizado de poucas tentativas do SEAL (Fonte: arXiv)

Quando aplicado a desafios de raciocínio abstrato do conjunto de dados ARC, o SEAL obteve 72,5% de sucesso - uma melhoria significativa em relação às abordagens padrão de aprendizado no contexto.

Aplicativos empresariais

Com a crescente preocupação com a exaustão de dados de treinamento de alta qualidade, a capacidade do SEAL para materiais de aprendizagem autogerados oferece um caminho sustentável. A tecnologia permite que os modelos aprofundem de forma autônoma sua compreensão de documentos complexos, como documentos de pesquisa ou relatórios financeiros, por meio da autoexplicação iterativa.

A estrutura é particularmente promissora para o desenvolvimento de agentes de IA, permitindo que os sistemas integrem permanentemente o conhecimento operacional das interações ambientais. Diferentemente das abordagens de programação estática, os agentes com tecnologia SEAL podem desenvolver suas competências ao longo do tempo, reduzindo a dependência da intervenção humana.

Limitações atuais

A implementação do SEAL enfrenta várias considerações práticas:

  • Esquecimento catastrófico: A autoedição contínua corre o risco de sobrescrever informações aprendidas anteriormente
  • Sobrecarga computacional: O processo de adaptação requer um tempo de processamento significativo
  • É necessária uma implementação híbrida: A combinação do SEAL com a geração aumentada por recuperação (RAG) pode otimizar o gerenciamento da memória

"Recomendamos que as empresas implementem ciclos de atualização programados em vez de adaptação contínua", aconselhou Pari. "Isso equilibra os benefícios da adaptação com as restrições operacionais práticas."

Melhoria progressiva do SEAL (Fonte: arXiv)

A pesquisa demonstra que os modelos de linguagem não precisam permanecer estáticos após o treinamento inicial. Ao aprender a gerar e aplicar suas próprias atualizações, eles podem expandir seu conhecimento de forma autônoma e se adaptar a novos desafios - um recurso que poderia redefinir a implementação da IA empresarial.

Artigo relacionado
Multiverse AI lança modelos inovadores de alto desempenho em miniatura Multiverse AI lança modelos inovadores de alto desempenho em miniatura Uma startup europeia pioneira em IA revelou modelos inovadores de IA de tamanho micro, batizados com nomes de cérebros de aves e insetos, demonstrando que a inteligência artificial avançada não exige
Estudo da Microsoft revela que mais tokens de IA aumentam os erros de raciocínio Estudo da Microsoft revela que mais tokens de IA aumentam os erros de raciocínio Insights emergentes sobre a eficiência do raciocínio do LLMUma nova pesquisa da Microsoft demonstra que as técnicas avançadas de raciocínio em modelos de linguagem grandes não produzem melhorias unifo
Por que os LLMs ignoram as instruções e como corrigi-las de forma eficaz Por que os LLMs ignoram as instruções e como corrigi-las de forma eficaz Entendendo por que os modelos de linguagem grande ignoram as instruçõesOs modelos de linguagem grande (LLMs) transformaram a forma como interagimos com a IA, permitindo aplicativos avançados que vão
Comentários (0)
0/200
De volta ao topo
OR