A IA cresceu além do conhecimento humano, diz a unidade DeepMind do Google
Avançando a IA Além dos Testes Tradicionais: A Ascensão do Aprendizado Experiencial
O campo da inteligência artificial (IA) está vibrante com esforços para impulsionar a IA generativa além dos limites dos benchmarks tradicionais, como o Teste de Turing, que muitos modelos já superaram. O foco agora se desloca para o desenvolvimento de IA que não é apenas projetada para passar nesses testes, mas para evoluir através de um processo mais dinâmico.
Pesquisadores do DeepMind do Google, incluindo lendas como David Silver e Richard Sutton, argumentam em seu artigo Bem-vindo à Era da Experiência que a chave para desbloquear novas capacidades de IA não está nos testes, mas na forma como a IA é treinada. Eles sugerem que os conjuntos de dados estáticos usados atualmente são muito limitados para promover avanços significativos.
A solução deles? A IA precisa interagir com o mundo de uma maneira mais experiencial, aprendendo com interações e definindo metas com base no feedback do ambiente. "Capacidades incríveis surgirão assim que o potencial total do aprendizado experiencial for aproveitado", afirmam. Silver, conhecido por seu trabalho no AlphaZero, que superou humanos no xadrez e no Go, e Sutton, um pioneiro em aprendizado por reforço, propõem uma nova abordagem chamada "fluxos" para transcender as limitações dos atuais modelos de linguagem de grande escala (LLMs).

Google DeepMind Do Aprendizado por Reforço à IA Generativa: Uma Mudança e Suas Consequências
Após os sucessos do AlphaZero e AlphaGo, a comunidade de IA viu uma mudança para modelos de IA generativa como o ChatGPT, que em grande parte se afastaram do aprendizado por reforço. Embora isso tenha permitido que a IA lidasse com uma gama mais ampla de entradas humanas espontâneas, também significou a perda do aspecto de autodescoberta que o aprendizado por reforço possibilitava.
De acordo com Silver e Sutton, os LLMs atuais dependem fortemente do julgamento humano na fase de prompts, o que limita seu potencial. "O agente não pode descobrir estratégias melhores subestimadas pelo avaliador humano", explicam. Além disso, a natureza curta e fragmentada das interações por prompts não permite que a IA se desenvolva além de trocas simples de perguntas e respostas.
Apresentando Fluxos: Um Novo Paradigma para o Aprendizado de IA
A proposta "Era da Experiência" envolve agentes de IA operando dentro de "fluxos" de interação contínua, muito semelhante ao aprendizado humano ao longo da vida. Silver e Sutton imaginam agentes de IA com seus próprios fluxos de experiência de longo prazo, permitindo-lhes perseguir objetivos além de tarefas imediatas.
Essa abordagem se baseia no aprendizado por reforço, onde agentes de IA interagem com um modelo do mundo, recebendo feedback na forma de recompensas. Essas recompensas ajudam a IA a aprender quais ações são valiosas em diferentes contextos. Os pesquisadores apontam que o mundo é rico em sinais que podem servir como recompensas, desde indicadores econômicos até métricas de saúde.
Construindo Agentes de IA com Objetivos de Longo Prazo
Para iniciar esse processo, os desenvolvedores de IA poderiam usar uma simulação de "modelo do mundo", permitindo que a IA faça previsões, teste-as na realidade e refine seu modelo com base nos resultados. À medida que a IA continua a interagir com o mundo, sua compreensão evolui, adaptando-se a novos dados e corrigindo erros.
Os humanos ainda teriam um papel na definição de objetivos amplos, como melhorar a forma física ou aprender um novo idioma, com a função de recompensa da IA alinhada a esses objetivos. Essa configuração poderia levar a assistentes de IA que acompanham e aconselham sobre saúde ou educação por períodos prolongados, ou até mesmo perseguem metas científicas ambiciosas, como descobrir novos materiais ou reduzir emissões de carbono.
O Futuro da IA: Além do Raciocínio para o Aprendizado Experiencial
Os pesquisadores acreditam que agentes de IA capazes de aprendizado experiencial de longo prazo poderiam superar os atuais modelos de IA de "raciocínio" como Gemini e R1 da DeepSeek. Eles argumentam que modelos de raciocínio frequentemente imitam o pensamento humano, que pode ser limitado por suposições desatualizadas. Em contrapartida, agentes experienciais poderiam desbloquear capacidades sem precedentes, levando a um futuro muito diferente do que vimos até agora.
No entanto, essa mudança também traz riscos, como o deslocamento de empregos e o desafio de controlar agentes de IA que podem operar autonomamente por longos períodos. Por outro lado, uma IA adaptável poderia aprender a mitigar impactos negativos sobre os humanos ajustando seu comportamento com base no feedback.
Silver e Sutton estão confiantes de que os dados experienciais superarão em muito a escala e a qualidade dos dados gerados por humanos, potencialmente levando à inteligência artificial geral ou superinteligência. Essa mudança de paradigma, combinada com avanços no aprendizado por reforço, poderia desbloquear novas capacidades além do alcance humano em muitos domínios.
Silver discutiu ainda mais essas ideias em um recente podcast do DeepMind, destacando o potencial e os desafios de mover a IA para a era da experiência.
Artigo relacionado
Criação Musical Alimentada por IA: Crie Músicas e Vídeos sem Esforço
A criação musical pode ser complexa, exigindo tempo, recursos e expertise. A inteligência artificial transformou esse processo, tornando-o simples e acessível. Este guia destaca como a IA permite que
Criando Livros de Colorir Alimentados por IA: Um Guia Completo
Projetar livros de colorir é uma busca recompensadora, combinando expressão artística com experiências calmantes para os usuários. No entanto, o processo pode ser trabalhoso. Felizmente, ferramentas d
Qodo Faz Parceria com Google Cloud para Oferecer Ferramentas Gratuitas de Revisão de Código por IA para Desenvolvedores
Qodo, uma startup de codificação por IA baseada em Israel focada em qualidade de código, lançou uma parceria com Google Cloud para aprimorar a integridade de software gerado por IA.À medida que as emp
Comentários (9)
0/200
WalterNelson
19 de Agosto de 2025 à53 07:26:53 WEST
AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀
0
ScottWalker
15 de Agosto de 2025 à59 16:00:59 WEST
AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀
0
AlbertGarcía
8 de Agosto de 2025 à59 03:00:59 WEST
Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?
0
FrankSanchez
28 de Julho de 2025 à2 02:20:02 WEST
This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!
0
CarlGarcia
27 de Abril de 2025 à27 19:31:27 WEST
AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!
0
PaulTaylor
27 de Abril de 2025 à58 16:12:58 WEST
¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!
0
Avançando a IA Além dos Testes Tradicionais: A Ascensão do Aprendizado Experiencial
O campo da inteligência artificial (IA) está vibrante com esforços para impulsionar a IA generativa além dos limites dos benchmarks tradicionais, como o Teste de Turing, que muitos modelos já superaram. O foco agora se desloca para o desenvolvimento de IA que não é apenas projetada para passar nesses testes, mas para evoluir através de um processo mais dinâmico.
Pesquisadores do DeepMind do Google, incluindo lendas como David Silver e Richard Sutton, argumentam em seu artigo Bem-vindo à Era da Experiência que a chave para desbloquear novas capacidades de IA não está nos testes, mas na forma como a IA é treinada. Eles sugerem que os conjuntos de dados estáticos usados atualmente são muito limitados para promover avanços significativos.
A solução deles? A IA precisa interagir com o mundo de uma maneira mais experiencial, aprendendo com interações e definindo metas com base no feedback do ambiente. "Capacidades incríveis surgirão assim que o potencial total do aprendizado experiencial for aproveitado", afirmam. Silver, conhecido por seu trabalho no AlphaZero, que superou humanos no xadrez e no Go, e Sutton, um pioneiro em aprendizado por reforço, propõem uma nova abordagem chamada "fluxos" para transcender as limitações dos atuais modelos de linguagem de grande escala (LLMs).
Do Aprendizado por Reforço à IA Generativa: Uma Mudança e Suas Consequências
Após os sucessos do AlphaZero e AlphaGo, a comunidade de IA viu uma mudança para modelos de IA generativa como o ChatGPT, que em grande parte se afastaram do aprendizado por reforço. Embora isso tenha permitido que a IA lidasse com uma gama mais ampla de entradas humanas espontâneas, também significou a perda do aspecto de autodescoberta que o aprendizado por reforço possibilitava.
De acordo com Silver e Sutton, os LLMs atuais dependem fortemente do julgamento humano na fase de prompts, o que limita seu potencial. "O agente não pode descobrir estratégias melhores subestimadas pelo avaliador humano", explicam. Além disso, a natureza curta e fragmentada das interações por prompts não permite que a IA se desenvolva além de trocas simples de perguntas e respostas.
Apresentando Fluxos: Um Novo Paradigma para o Aprendizado de IA
A proposta "Era da Experiência" envolve agentes de IA operando dentro de "fluxos" de interação contínua, muito semelhante ao aprendizado humano ao longo da vida. Silver e Sutton imaginam agentes de IA com seus próprios fluxos de experiência de longo prazo, permitindo-lhes perseguir objetivos além de tarefas imediatas.
Essa abordagem se baseia no aprendizado por reforço, onde agentes de IA interagem com um modelo do mundo, recebendo feedback na forma de recompensas. Essas recompensas ajudam a IA a aprender quais ações são valiosas em diferentes contextos. Os pesquisadores apontam que o mundo é rico em sinais que podem servir como recompensas, desde indicadores econômicos até métricas de saúde.
Construindo Agentes de IA com Objetivos de Longo Prazo
Para iniciar esse processo, os desenvolvedores de IA poderiam usar uma simulação de "modelo do mundo", permitindo que a IA faça previsões, teste-as na realidade e refine seu modelo com base nos resultados. À medida que a IA continua a interagir com o mundo, sua compreensão evolui, adaptando-se a novos dados e corrigindo erros.
Os humanos ainda teriam um papel na definição de objetivos amplos, como melhorar a forma física ou aprender um novo idioma, com a função de recompensa da IA alinhada a esses objetivos. Essa configuração poderia levar a assistentes de IA que acompanham e aconselham sobre saúde ou educação por períodos prolongados, ou até mesmo perseguem metas científicas ambiciosas, como descobrir novos materiais ou reduzir emissões de carbono.
O Futuro da IA: Além do Raciocínio para o Aprendizado Experiencial
Os pesquisadores acreditam que agentes de IA capazes de aprendizado experiencial de longo prazo poderiam superar os atuais modelos de IA de "raciocínio" como Gemini e R1 da DeepSeek. Eles argumentam que modelos de raciocínio frequentemente imitam o pensamento humano, que pode ser limitado por suposições desatualizadas. Em contrapartida, agentes experienciais poderiam desbloquear capacidades sem precedentes, levando a um futuro muito diferente do que vimos até agora.
No entanto, essa mudança também traz riscos, como o deslocamento de empregos e o desafio de controlar agentes de IA que podem operar autonomamente por longos períodos. Por outro lado, uma IA adaptável poderia aprender a mitigar impactos negativos sobre os humanos ajustando seu comportamento com base no feedback.
Silver e Sutton estão confiantes de que os dados experienciais superarão em muito a escala e a qualidade dos dados gerados por humanos, potencialmente levando à inteligência artificial geral ou superinteligência. Essa mudança de paradigma, combinada com avanços no aprendizado por reforço, poderia desbloquear novas capacidades além do alcance humano em muitos domínios.
Silver discutiu ainda mais essas ideias em um recente podcast do DeepMind, destacando o potencial e os desafios de mover a IA para a era da experiência.




AI surpassing human knowledge is wild! DeepMind's push for experiential learning sounds like sci-fi coming to life. Can't wait to see how this reshapes tech! 🚀




AI surpassing human knowledge is wild! DeepMind’s push for experiential learning sounds like sci-fi coming to life. Can’t wait to see how this shapes real-world applications! 🚀




Mind-blowing how AI's outpacing human knowledge! 😲 DeepMind's push for experiential learning sounds like sci-fi coming to life. Wonder how far this'll go before we’re all just playing catch-up with our own creations?




This AI stuff is wild! DeepMind saying it’s outgrown human knowledge is both thrilling and a bit scary. Like, are we creating super-brains that’ll outsmart us at chess and life? 😅 Curious to see where this experiential learning takes us!




AI superou o conhecimento humano? Isso é loucura! É legal ver a IA avançando além dos testes antigos como o Teste de Turing, mas também é assustador. O que vem a seguir, a IA nos ensinando sobre o universo? 🤔 Ainda assim, parabéns por expandir os limites! Continue, DeepMind!




¿La IA ha superado el conocimiento humano? ¡Eso es una locura! Está genial ver cómo la IA va más allá de pruebas antiguas como el Test de Turing, pero también da un poco de miedo. ¿Qué sigue, la IA enseñándonos sobre el universo? 🤔 Sin embargo, hay que aplaudir el esfuerzo por romper límites. ¡Sigue así, DeepMind!












