opção
Lar
Notícias
A IA cresceu além do conhecimento humano, diz a unidade DeepMind do Google

A IA cresceu além do conhecimento humano, diz a unidade DeepMind do Google

26 de Abril de 2025
149

Avançando a IA Além dos Testes Tradicionais: A Ascensão do Aprendizado Experiencial

O campo da inteligência artificial (IA) está vibrante com esforços para impulsionar a IA generativa além dos limites dos benchmarks tradicionais, como o Teste de Turing, que muitos modelos já superaram. O foco agora se desloca para o desenvolvimento de IA que não é apenas projetada para passar nesses testes, mas para evoluir através de um processo mais dinâmico.

Pesquisadores do DeepMind do Google, incluindo lendas como David Silver e Richard Sutton, argumentam em seu artigo Bem-vindo à Era da Experiência que a chave para desbloquear novas capacidades de IA não está nos testes, mas na forma como a IA é treinada. Eles sugerem que os conjuntos de dados estáticos usados atualmente são muito limitados para promover avanços significativos.

A solução deles? A IA precisa interagir com o mundo de uma maneira mais experiencial, aprendendo com interações e definindo metas com base no feedback do ambiente. "Capacidades incríveis surgirão assim que o potencial total do aprendizado experiencial for aproveitado", afirmam. Silver, conhecido por seu trabalho no AlphaZero, que superou humanos no xadrez e no Go, e Sutton, um pioneiro em aprendizado por reforço, propõem uma nova abordagem chamada "fluxos" para transcender as limitações dos atuais modelos de linguagem de grande escala (LLMs).

Google DeepMind

Google DeepMind

Do Aprendizado por Reforço à IA Generativa: Uma Mudança e Suas Consequências

Após os sucessos do AlphaZero e AlphaGo, a comunidade de IA viu uma mudança para modelos de IA generativa como o ChatGPT, que em grande parte se afastaram do aprendizado por reforço. Embora isso tenha permitido que a IA lidasse com uma gama mais ampla de entradas humanas espontâneas, também significou a perda do aspecto de autodescoberta que o aprendizado por reforço possibilitava.

De acordo com Silver e Sutton, os LLMs atuais dependem fortemente do julgamento humano na fase de prompts, o que limita seu potencial. "O agente não pode descobrir estratégias melhores subestimadas pelo avaliador humano", explicam. Além disso, a natureza curta e fragmentada das interações por prompts não permite que a IA se desenvolva além de trocas simples de perguntas e respostas.

Apresentando Fluxos: Um Novo Paradigma para o Aprendizado de IA

A proposta "Era da Experiência" envolve agentes de IA operando dentro de "fluxos" de interação contínua, muito semelhante ao aprendizado humano ao longo da vida. Silver e Sutton imaginam agentes de IA com seus próprios fluxos de experiência de longo prazo, permitindo-lhes perseguir objetivos além de tarefas imediatas.

Essa abordagem se baseia no aprendizado por reforço, onde agentes de IA interagem com um modelo do mundo, recebendo feedback na forma de recompensas. Essas recompensas ajudam a IA a aprender quais ações são valiosas em diferentes contextos. Os pesquisadores apontam que o mundo é rico em sinais que podem servir como recompensas, desde indicadores econômicos até métricas de saúde.

Construindo Agentes de IA com Objetivos de Longo Prazo

Para iniciar esse processo, os desenvolvedores de IA poderiam usar uma simulação de "modelo do mundo", permitindo que a IA faça previsões, teste-as na realidade e refine seu modelo com base nos resultados. À medida que a IA continua a interagir com o mundo, sua compreensão evolui, adaptando-se a novos dados e corrigindo erros.

Os humanos ainda teriam um papel na definição de objetivos amplos, como melhorar a forma física ou aprender um novo idioma, com a função de recompensa da IA alinhada a esses objetivos. Essa configuração poderia levar a assistentes de IA que acompanham e aconselham sobre saúde ou educação por períodos prolongados, ou até mesmo perseguem metas científicas ambiciosas, como descobrir novos materiais ou reduzir emissões de carbono.

O Futuro da IA: Além do Raciocínio para o Aprendizado Experiencial

Os pesquisadores acreditam que agentes de IA capazes de aprendizado experiencial de longo prazo poderiam superar os atuais modelos de IA de "raciocínio" como Gemini e R1 da DeepSeek. Eles argumentam que modelos de raciocínio frequentemente imitam o pensamento humano, que pode ser limitado por suposições desatualizadas. Em contrapartida, agentes experienciais poderiam desbloquear capacidades sem precedentes, levando a um futuro muito diferente do que vimos até agora.

No entanto, essa mudança também traz riscos, como o deslocamento de empregos e o desafio de controlar agentes de IA que podem operar autonomamente por longos períodos. Por outro lado, uma IA adaptável poderia aprender a mitigar impactos negativos sobre os humanos ajustando seu comportamento com base no feedback.

Silver e Sutton estão confiantes de que os dados experienciais superarão em muito a escala e a qualidade dos dados gerados por humanos, potencialmente levando à inteligência artificial geral ou superinteligência. Essa mudança de paradigma, combinada com avanços no aprendizado por reforço, poderia desbloquear novas capacidades além do alcance humano em muitos domínios.

Silver discutiu ainda mais essas ideias em um recente podcast do DeepMind, destacando o potencial e os desafios de mover a IA para a era da experiência.

Artigo relacionado
Cartas de apresentação com tecnologia de IA: Guia especializado para submissão de artigos em periódicos Cartas de apresentação com tecnologia de IA: Guia especializado para submissão de artigos em periódicos No competitivo ambiente de publicação acadêmica de hoje, a elaboração de uma carta de apresentação eficaz pode fazer a diferença crucial na aceitação do seu manuscrito. Descubra como as ferramentas co
EUA sancionarão autoridades estrangeiras por causa de regulamentações de mídia social EUA sancionarão autoridades estrangeiras por causa de regulamentações de mídia social EUA se posicionam contra as regulamentações globais de conteúdo digitalO Departamento de Estado emitiu uma forte repreensão diplomática nesta semana, visando às políticas europeias de governança dig
Guia definitivo para resumidores de vídeos do YouTube com tecnologia de IA Guia definitivo para resumidores de vídeos do YouTube com tecnologia de IA Em nosso cenário digital rico em informações, os resumidores de vídeo do YouTube com tecnologia de IA se tornaram indispensáveis para o consumo eficiente de conteúdo. Este guia detalhado explora como
Comentários (10)
0/200
SophiaCampbell
SophiaCampbell 26 de Agosto de 2025 à22 06:59:22 WEST

It's wild how AI is outpacing human knowledge! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see where this takes us, but I hope they keep ethics in check! 😎

WalterNelson
WalterNelson 19 de Agosto de 2025 à53 07:26:53 WEST

AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀

ScottWalker
ScottWalker 15 de Agosto de 2025 à59 16:00:59 WEST

AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀

AlbertGarcía
AlbertGarcía 8 de Agosto de 2025 à59 03:00:59 WEST

Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?

FrankSanchez
FrankSanchez 28 de Julho de 2025 à2 02:20:02 WEST

This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!

CarlGarcia
CarlGarcia 27 de Abril de 2025 à27 19:31:27 WEST

AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!

De volta ao topo
OR