OpenAI corre para criar uma IA universal capaz de lidar com qualquer tarefa
Pouco depois de Hunter Lightman se tornar pesquisador da OpenAI em 2022, ele testemunhou o lançamento explosivo do ChatGPT - um dos produtos de crescimento mais rápido da história da tecnologia. Enquanto isso, o trabalho mais tranquilo de Lightman se concentrava em treinar os modelos da OpenAI para enfrentar competições de matemática de elite no ensino médio.
Hoje, sua equipe - MathGen - desempenha um papel fundamental na busca da OpenAI para criar modelos de raciocínio de IA líderes do setor. Esses sistemas formam a espinha dorsal dos "agentes de IA" capazes de realizar tarefas computacionais semelhantes às humanas.
"No início, nosso objetivo era melhorar o raciocínio matemático - uma área em que os modelos tinham dificuldades", disse Lightman ao TechCrunch sobre as origens do MathGen.
Apesar do progresso, os modelos da OpenAI continuam imperfeitos. Até mesmo seus sistemas mais recentes alucinam fatos e vacilam em tarefas complexas.
No entanto, o raciocínio matemático melhorou muito. Recentemente, um modelo conquistou o ouro na Olimpíada Internacional de Matemática - um concurso para os estudantes de matemática mais brilhantes do mundo. A OpenAI acredita que esses recursos de raciocínio se estenderão a outros domínios, alimentando seus agentes de IA de uso geral há muito previstos.
Embora o sucesso do ChatGPT tenha sido casual, o desenvolvimento do agente da OpenAI representa anos de esforço deliberado. "Em breve, você simplesmente pedirá aos computadores que realizem tarefas", previu o CEO Sam Altman na conferência de desenvolvedores da OpenAI em 2023. "Chamamos isso de 'agentes' - seu potencial é impressionante."
Titãs da tecnologia confirmados para o Disrupt 2025
Netflix, ElevenLabs, Wayve e Sequoia Capital lideram uma linha de estrelas para o 20º aniversário do TechCrunch Disrupt. Obtenha insights práticos das principais mentes da tecnologia - garanta seus ingressos hoje mesmo e economize até US$ 675 antes que o preço aumente.
Titãs da tecnologia confirmados para o Disrupt 2025
Netflix, ElevenLabs, Wayve e Sequoia Capital lideram uma linha de estrelas para o 20º aniversário do TechCrunch Disrupt. Obtenha percepções práticas das principais mentes da tecnologia - garanta seus ingressos hoje mesmo e economize até US$ 675 antes do aumento dos preços.
São Francisco | 27 a 29 de outubro de 2025 | INSCREVA-SE AGORA

Sam Altman, CEO da OpenAI, falando no DevDay 2023 (Foto: Justin Sullivan/Getty Images) Embora a visão de Altman ainda não tenha sido comprovada, a OpenAI surpreendeu o mundo da tecnologia com seu modelo de raciocínio "o1" em 2024. Em poucos meses, seus 21 pesquisadores se tornaram os talentos mais cobiçados do Vale do Silício - a Meta contratou cinco deles, oferecendo pacotes de remuneração de nove dígitos.
O renascimento do aprendizado por reforço
As descobertas dos agentes da OpenAI estão ligadas ao aprendizado por reforço (RL) - onde os modelos de IA aprendem por meio de tentativa e erro simulados. Embora a RL remonte ao marco do AlphaGo em 2016, a OpenAI passou anos adaptando-a para agentes de uso computacional.
Os primeiros modelos de GPT eram excelentes em texto, mas falharam em matemática básica. O projeto "Strawberry" de 2023 combinou a RL com a computação em tempo de teste - permitindo que os modelos verificassem as etapas antes de responder - e foi pioneiro no raciocínio de "cadeia de pensamento".
"De repente, os modelos podiam voltar atrás e se autocorrigir - parecia humano", lembrou o pesquisador El Kishky.
Expansão dos recursos de raciocínio
A OpenAI identificou dois vetores de escalonamento: computação pós-treinamento e alocação de tempo de resposta. "Não construímos apenas para hoje - construímos para a escalabilidade", observou Lightman.
Uma equipe dedicada de "Agentes" surgiu em 2023, estabelecendo as bases para a o1. Ao contrário de rivais limitados por demandas de produtos, a OpenAI priorizou a pesquisa de AGI - uma vantagem estratégica.
Definição de raciocínio de IA
Os pesquisadores debatem se a IA realmente "raciocina". Alguns enfatizam a eficiência computacional; outros se concentram em resultados semelhantes aos humanos. Existem críticas, mas as capacidades são mais importantes - assim como os aviões voam de forma diferente dos pássaros.
O desafio das tarefas subjetivas
Os agentes atuais lidam bem com a codificação, mas têm dificuldades com as nuances, como as compras on-line. "É fundamentalmente um desafio de dados", explicou Lightman. Novas técnicas permitem o treinamento em tarefas menos verificáveis.
A solução IMO da OpenAI utilizou a exploração de vários agentes - agora emulada pelo Google e pela xAI. Para o pesquisador Noam Brown, o progresso rápido continua: "Não há nenhuma desaceleração à vista".
Com o GPT-5 se aproximando, a OpenAI pretende manter sua vantagem em relação ao Google, Anthropic e Meta. O objetivo final? Um agente que executa intuitivamente qualquer tarefa digital - superando totalmente o ChatGPT atual.
Artigo relacionado
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
O CEO da Vercel, Guillermo Rauch, dá indícios de uma oferta pública inicial (IPO), à medida que os agentes de IA impulsionam a receita
Ao contrário de muitas startups fundadas antes do ChatGPT que agora enfrentam dificuldades para se firmar na era da IA, a Vercel, uma ferramenta de desenvolvimento e plataforma de hospedagem de sites
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c
Recomendações de tópicos especiais relacionados
Comentários (0)
Pouco depois de Hunter Lightman se tornar pesquisador da OpenAI em 2022, ele testemunhou o lançamento explosivo do ChatGPT - um dos produtos de crescimento mais rápido da história da tecnologia. Enquanto isso, o trabalho mais tranquilo de Lightman se concentrava em treinar os modelos da OpenAI para enfrentar competições de matemática de elite no ensino médio.
Hoje, sua equipe - MathGen - desempenha um papel fundamental na busca da OpenAI para criar modelos de raciocínio de IA líderes do setor. Esses sistemas formam a espinha dorsal dos "agentes de IA" capazes de realizar tarefas computacionais semelhantes às humanas.
"No início, nosso objetivo era melhorar o raciocínio matemático - uma área em que os modelos tinham dificuldades", disse Lightman ao TechCrunch sobre as origens do MathGen.
Apesar do progresso, os modelos da OpenAI continuam imperfeitos. Até mesmo seus sistemas mais recentes alucinam fatos e vacilam em tarefas complexas.
No entanto, o raciocínio matemático melhorou muito. Recentemente, um modelo conquistou o ouro na Olimpíada Internacional de Matemática - um concurso para os estudantes de matemática mais brilhantes do mundo. A OpenAI acredita que esses recursos de raciocínio se estenderão a outros domínios, alimentando seus agentes de IA de uso geral há muito previstos.
Embora o sucesso do ChatGPT tenha sido casual, o desenvolvimento do agente da OpenAI representa anos de esforço deliberado. "Em breve, você simplesmente pedirá aos computadores que realizem tarefas", previu o CEO Sam Altman na conferência de desenvolvedores da OpenAI em 2023. "Chamamos isso de 'agentes' - seu potencial é impressionante."
Titãs da tecnologia confirmados para o Disrupt 2025
Netflix, ElevenLabs, Wayve e Sequoia Capital lideram uma linha de estrelas para o 20º aniversário do TechCrunch Disrupt. Obtenha insights práticos das principais mentes da tecnologia - garanta seus ingressos hoje mesmo e economize até US$ 675 antes que o preço aumente.
Titãs da tecnologia confirmados para o Disrupt 2025
Netflix, ElevenLabs, Wayve e Sequoia Capital lideram uma linha de estrelas para o 20º aniversário do TechCrunch Disrupt. Obtenha percepções práticas das principais mentes da tecnologia - garanta seus ingressos hoje mesmo e economize até US$ 675 antes do aumento dos preços.
São Francisco | 27 a 29 de outubro de 2025 | INSCREVA-SE AGORA

Embora a visão de Altman ainda não tenha sido comprovada, a OpenAI surpreendeu o mundo da tecnologia com seu modelo de raciocínio "o1" em 2024. Em poucos meses, seus 21 pesquisadores se tornaram os talentos mais cobiçados do Vale do Silício - a Meta contratou cinco deles, oferecendo pacotes de remuneração de nove dígitos.
O renascimento do aprendizado por reforço
As descobertas dos agentes da OpenAI estão ligadas ao aprendizado por reforço (RL) - onde os modelos de IA aprendem por meio de tentativa e erro simulados. Embora a RL remonte ao marco do AlphaGo em 2016, a OpenAI passou anos adaptando-a para agentes de uso computacional.
Os primeiros modelos de GPT eram excelentes em texto, mas falharam em matemática básica. O projeto "Strawberry" de 2023 combinou a RL com a computação em tempo de teste - permitindo que os modelos verificassem as etapas antes de responder - e foi pioneiro no raciocínio de "cadeia de pensamento".
"De repente, os modelos podiam voltar atrás e se autocorrigir - parecia humano", lembrou o pesquisador El Kishky.
Expansão dos recursos de raciocínio
A OpenAI identificou dois vetores de escalonamento: computação pós-treinamento e alocação de tempo de resposta. "Não construímos apenas para hoje - construímos para a escalabilidade", observou Lightman.
Uma equipe dedicada de "Agentes" surgiu em 2023, estabelecendo as bases para a o1. Ao contrário de rivais limitados por demandas de produtos, a OpenAI priorizou a pesquisa de AGI - uma vantagem estratégica.
Definição de raciocínio de IA
Os pesquisadores debatem se a IA realmente "raciocina". Alguns enfatizam a eficiência computacional; outros se concentram em resultados semelhantes aos humanos. Existem críticas, mas as capacidades são mais importantes - assim como os aviões voam de forma diferente dos pássaros.
O desafio das tarefas subjetivas
Os agentes atuais lidam bem com a codificação, mas têm dificuldades com as nuances, como as compras on-line. "É fundamentalmente um desafio de dados", explicou Lightman. Novas técnicas permitem o treinamento em tarefas menos verificáveis.
A solução IMO da OpenAI utilizou a exploração de vários agentes - agora emulada pelo Google e pela xAI. Para o pesquisador Noam Brown, o progresso rápido continua: "Não há nenhuma desaceleração à vista".
Com o GPT-5 se aproximando, a OpenAI pretende manter sua vantagem em relação ao Google, Anthropic e Meta. O objetivo final? Um agente que executa intuitivamente qualquer tarefa digital - superando totalmente o ChatGPT atual.
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
O CEO da Vercel, Guillermo Rauch, dá indícios de uma oferta pública inicial (IPO), à medida que os agentes de IA impulsionam a receita
Ao contrário de muitas startups fundadas antes do ChatGPT que agora enfrentam dificuldades para se firmar na era da IA, a Vercel, uma ferramenta de desenvolvimento e plataforma de hospedagem de sites
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c





Lar






