O papel de segurança AGI do DeepMind não balança os céticos

Na quarta-feira, o Google DeepMind publicou um extenso artigo de 145 páginas explorando profundamente sua abordagem à segurança de AGI. AGI, ou inteligência geral artificial, é o tipo de IA que pode realizar qualquer tarefa que um humano pode, e é um tema quente no mundo da IA. Alguns acham que é apenas uma fantasia, enquanto outros, como os grandes nomes da Anthropic, acreditam que está logo ali na esquina e pode causar sérios problemas se não tivermos medidas de segurança adequadas.
O artigo da DeepMind, escrito com a ajuda do cofundador Shane Legg, estima que a AGI pode aparecer até 2030 e poderia levar ao que eles chamam de "dano severo". Eles não detalham exatamente, mas usam frases assustadoras como "riscos existenciais" que poderiam "destruir permanentemente a humanidade".
"Estamos apostando em ver uma AGI Excepcional antes do fim desta década", notam os autores. "Uma AGI Excepcional é um sistema que pode igualar as habilidades dos 1% melhores adultos em várias tarefas não físicas, incluindo coisas complicadas como aprender novas habilidades."
Logo no início, o artigo compara a abordagem da DeepMind para lidar com o risco de AGI com a da Anthropic e da OpenAI. Diz que a Anthropic não é tão focada em "treinamento robusto, monitoramento e segurança", enquanto a OpenAI é toda sobre "automatizar" um tipo de pesquisa de segurança de IA chamada pesquisa de alinhamento.
O artigo também critica a ideia de IA superinteligente — IA que é melhor em tarefas do que qualquer humano. (A OpenAI recentemente disse que está mudando seu foco de AGI para superinteligência.) Sem grandes avanços novos, os autores da DeepMind não acreditam que sistemas superinteligentes estejam chegando tão cedo — ou talvez nunca.
Mas eles acreditam que é possível que nossos métodos atuais possam levar a uma "melhoria recursiva de IA", onde a IA faz sua própria pesquisa de IA para criar sistemas ainda mais inteligentes. E isso, eles alertam, pode ser extremamente perigoso.
No geral, o artigo sugere que precisamos desenvolver maneiras de manter atores mal-intencionados longe da AGI, entender melhor o que os sistemas de IA estão fazendo e tornar os ambientes onde a IA opera mais seguros. Eles admitem que muitas dessas ideias ainda estão em estágios iniciais e têm "problemas de pesquisa abertos", mas pedem que não ignoremos os problemas de segurança que podem estar a caminho.
"A AGI pode trazer benefícios incríveis ou danos sérios", apontam os autores. "Portanto, para construir a AGI da maneira certa, é crucial que os principais desenvolvedores de IA planejem com antecedência e enfrentem esses grandes riscos."
Nem todos concordam com as ideias do artigo, no entanto.
Heidy Khlaaf, cientista-chefe de IA do AI Now Institute, disse ao TechCrunch que acha que a AGI é um conceito muito vago para ser "avaliado cientificamente com rigor". Outro pesquisador de IA, Matthew Guzdial, da Universidade de Alberta, disse que não está convencido de que a melhoria recursiva de IA seja viável agora.
"A melhoria recursiva é a base dos argumentos da singularidade de inteligência", disse Guzdial ao TechCrunch, "mas nunca vimos nenhuma evidência de que isso realmente funciona."
Sandra Wachter, que estuda tecnologia e regulamentação em Oxford, aponta uma preocupação mais urgente: a IA reforçando a si mesma com "saídas imprecisas".
"Com cada vez mais conteúdo gerado por IA online e dados reais sendo substituídos, os modelos estão aprendendo com suas próprias saídas cheias de imprecisões ou alucinações", ela disse ao TechCrunch. "Como os chatbots são usados principalmente para buscar e encontrar a verdade, estamos sempre em risco de receber informações falsas apresentadas de forma muito convincente."
Por mais completo que seja, o artigo da DeepMind provavelmente não encerrará os debates sobre quão provável a AGI realmente é — e quais questões de segurança de IA precisam de mais atenção agora.
Artigo relacionado
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Co-fundador da Databricks afirma que a IA geral está chegando após receber o prêmio da ACM
Matei Zaharia, cofundador e diretor de tecnologia (CTO) da Databricks, quase deixou passar despercebido o e-mail que o informava de que havia sido agraciado com o Prêmio ACM de Computação de 2026. “Fo
Sam Altman, da OpenAI, declara o início da era da superinteligência
O CEO da OpenAI, Sam Altman, anunciou que a humanidade entrou na era da superinteligência artificial e que não há mais volta.“Passamos do ponto sem volta; a ascensão começou”, afirma Altman. “Estamos
Recomendações de tópicos especiais relacionados
Comentários (52)
Interesting read! But honestly, a 145-page paper from DeepMind feels more like a corporate PR move than a real solution. Can we really trust the same companies racing to build AGI to also be the ones setting safety rules? 🧐 It's like letting foxes design the henhouse security. I'd love to see more independent oversight and less glossy documentation.
Este artículo me hace pensar que la seguridad de AGI es como intentar construir un paracaídas mientras ya estás cayendo del avión. DeepMind tiene buenas intenciones, pero 145 páginas no van a convencer a los escépticos si no demuestran resultados prácticos. 🤔 ¿Alguien más siente que estas discusiones se repiten cada seis meses sin avances reales?
Mais um artigo gigante sobre segurança de AGI... Será que alguém realmente lê essas 145 páginas? 🤨 Parece que o DeepMind tá mais preocupado em mostrar volume do que convencer os críticos. Cadê os resultados práticos?
Este artículo sobre seguridad en AGI es interesante, pero me pregunto si realmente podemos confiar en las grandes empresas tecnológicas para autorregularse. 🤨 DeepMind habla de seguridad, pero al final todo se reduce a ganancias y competencia. ¿Será solo otro documento para calmar a los reguladores?
This paper's a beast, but I'm not sold on DeepMind's AGI safety promises. Feels like they're hyping it up without tackling the real ethical mess. Anyone else think it's just fancy PR? 🤔

Na quarta-feira, o Google DeepMind publicou um extenso artigo de 145 páginas explorando profundamente sua abordagem à segurança de AGI. AGI, ou inteligência geral artificial, é o tipo de IA que pode realizar qualquer tarefa que um humano pode, e é um tema quente no mundo da IA. Alguns acham que é apenas uma fantasia, enquanto outros, como os grandes nomes da Anthropic, acreditam que está logo ali na esquina e pode causar sérios problemas se não tivermos medidas de segurança adequadas.
O artigo da DeepMind, escrito com a ajuda do cofundador Shane Legg, estima que a AGI pode aparecer até 2030 e poderia levar ao que eles chamam de "dano severo". Eles não detalham exatamente, mas usam frases assustadoras como "riscos existenciais" que poderiam "destruir permanentemente a humanidade".
"Estamos apostando em ver uma AGI Excepcional antes do fim desta década", notam os autores. "Uma AGI Excepcional é um sistema que pode igualar as habilidades dos 1% melhores adultos em várias tarefas não físicas, incluindo coisas complicadas como aprender novas habilidades."
Logo no início, o artigo compara a abordagem da DeepMind para lidar com o risco de AGI com a da Anthropic e da OpenAI. Diz que a Anthropic não é tão focada em "treinamento robusto, monitoramento e segurança", enquanto a OpenAI é toda sobre "automatizar" um tipo de pesquisa de segurança de IA chamada pesquisa de alinhamento.
O artigo também critica a ideia de IA superinteligente — IA que é melhor em tarefas do que qualquer humano. (A OpenAI recentemente disse que está mudando seu foco de AGI para superinteligência.) Sem grandes avanços novos, os autores da DeepMind não acreditam que sistemas superinteligentes estejam chegando tão cedo — ou talvez nunca.
Mas eles acreditam que é possível que nossos métodos atuais possam levar a uma "melhoria recursiva de IA", onde a IA faz sua própria pesquisa de IA para criar sistemas ainda mais inteligentes. E isso, eles alertam, pode ser extremamente perigoso.
No geral, o artigo sugere que precisamos desenvolver maneiras de manter atores mal-intencionados longe da AGI, entender melhor o que os sistemas de IA estão fazendo e tornar os ambientes onde a IA opera mais seguros. Eles admitem que muitas dessas ideias ainda estão em estágios iniciais e têm "problemas de pesquisa abertos", mas pedem que não ignoremos os problemas de segurança que podem estar a caminho.
"A AGI pode trazer benefícios incríveis ou danos sérios", apontam os autores. "Portanto, para construir a AGI da maneira certa, é crucial que os principais desenvolvedores de IA planejem com antecedência e enfrentem esses grandes riscos."
Nem todos concordam com as ideias do artigo, no entanto.
Heidy Khlaaf, cientista-chefe de IA do AI Now Institute, disse ao TechCrunch que acha que a AGI é um conceito muito vago para ser "avaliado cientificamente com rigor". Outro pesquisador de IA, Matthew Guzdial, da Universidade de Alberta, disse que não está convencido de que a melhoria recursiva de IA seja viável agora.
"A melhoria recursiva é a base dos argumentos da singularidade de inteligência", disse Guzdial ao TechCrunch, "mas nunca vimos nenhuma evidência de que isso realmente funciona."
Sandra Wachter, que estuda tecnologia e regulamentação em Oxford, aponta uma preocupação mais urgente: a IA reforçando a si mesma com "saídas imprecisas".
"Com cada vez mais conteúdo gerado por IA online e dados reais sendo substituídos, os modelos estão aprendendo com suas próprias saídas cheias de imprecisões ou alucinações", ela disse ao TechCrunch. "Como os chatbots são usados principalmente para buscar e encontrar a verdade, estamos sempre em risco de receber informações falsas apresentadas de forma muito convincente."
Por mais completo que seja, o artigo da DeepMind provavelmente não encerrará os debates sobre quão provável a AGI realmente é — e quais questões de segurança de IA precisam de mais atenção agora.
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Co-fundador da Databricks afirma que a IA geral está chegando após receber o prêmio da ACM
Matei Zaharia, cofundador e diretor de tecnologia (CTO) da Databricks, quase deixou passar despercebido o e-mail que o informava de que havia sido agraciado com o Prêmio ACM de Computação de 2026. “Fo
Interesting read! But honestly, a 145-page paper from DeepMind feels more like a corporate PR move than a real solution. Can we really trust the same companies racing to build AGI to also be the ones setting safety rules? 🧐 It's like letting foxes design the henhouse security. I'd love to see more independent oversight and less glossy documentation.
Este artículo me hace pensar que la seguridad de AGI es como intentar construir un paracaídas mientras ya estás cayendo del avión. DeepMind tiene buenas intenciones, pero 145 páginas no van a convencer a los escépticos si no demuestran resultados prácticos. 🤔 ¿Alguien más siente que estas discusiones se repiten cada seis meses sin avances reales?
Mais um artigo gigante sobre segurança de AGI... Será que alguém realmente lê essas 145 páginas? 🤨 Parece que o DeepMind tá mais preocupado em mostrar volume do que convencer os críticos. Cadê os resultados práticos?
Este artículo sobre seguridad en AGI es interesante, pero me pregunto si realmente podemos confiar en las grandes empresas tecnológicas para autorregularse. 🤨 DeepMind habla de seguridad, pero al final todo se reduce a ganancias y competencia. ¿Será solo otro documento para calmar a los reguladores?
This paper's a beast, but I'm not sold on DeepMind's AGI safety promises. Feels like they're hyping it up without tackling the real ethical mess. Anyone else think it's just fancy PR? 🤔





Lar






