A GPT-5 da OpenAI rivaliza com o desempenho humano em diversas profissões
Na quinta-feira, a OpenAI apresentou o GDPval, um marco revolucionário que avalia como seus modelos de IA se comparam a profissionais humanos em diversos setores. Esta avaliação representa um passo inicial para medir se os sistemas da OpenAI podem superar humanos em trabalhos economicamente impactantes – um objetivo central na busca da empresa pela inteligência artificial geral (IAG).
De acordo com a OpenAI, tanto o GPT-5 quanto o Claude Opus 4.1 da Anthropic demonstram qualidade de saída aproximando-se da de especialistas do setor.
Embora essas descobertas não impliquem a substituição iminente de empregos humanos, elas representam um acompanhamento crucial do progresso. A OpenAI reconhece que o GDPval atualmente avalia apenas uma fração das tarefas profissionais do mundo real, contradizendo as previsões de alguns CEOs sobre uma disruptura generalizada da IA em alguns anos.
O GDPval avalia o desempenho em nove setores-chave do PIB dos EUA – incluindo saúde, finanças, manufatura e governo – testando 44 ocupações, desde engenharia de software até jornalismo.
Para o GDPval-v0, profissionais compararam relatórios gerados por IA com o trabalho de suas contrapartes humanas. Uma tarefa de exemplo envolveu banqueiros de investimento analisando panoramas de concorrentes de entrega de última milha versus versões de IA. A OpenAI calculou a "taxa de vitória" de cada modelo contra as saídas humanas em todas as ocupações.
O modelo aprimorado GPT-5-high igualou ou excedeu a saída de especialistas em 40,6% das vezes, enquanto o Claude Opus 4.1 atingiu uma taxa de paridade de 49% – a OpenAI sugere que essa pontuação mais alta pode refletir a apresentação visual superior do Claude,而非 uma vantagem substantiva.
Conecte-se com mais de 10.000 inovadores de tecnologia e VC no Disrupt 2025
Com Netflix, Box, a16z, ElevenLabs, Wayve, Sequoia Capital e Elad Gil entre mais de 250 líderes do setor hospedando mais de 200 sessões focadas em crescimento. Celebre o 20º aniversário da TechCrunch enquanto obtém insights competitivos dos principais pensadores da tecnologia. O registro antecipado antes de 26 de setembro economiza até US$ 668.
Conecte-se com mais de 10.000 inovadores de tecnologia e VC no Disrupt 2025
Com Netflix, Box, a16z, ElevenLabs, Wayve, Sequoia Capital e Elad Gil entre mais de 250 líderes do setor hospedando mais de 200 sessões focadas em crescimento. Celebre o 20º aniversário da TechCrunch enquanto obtém insights competitivos dos principais pensadores da tecnologia. O registro antecipado antes de 26 de setembro economiza até US$ 668.

Créditos da imagem: OpenAI A OpenAI reconhece o foco restrito do GDPval-v0 – atualmente testando apenas a geração de relatórios de pesquisa – e planeja iterações futuras avaliando interações mais amplas no local de trabalho.
O economista-chefe, Dr. Aaron Chatterji, disse à TechCrunch que esses resultados indicam que os profissionais podem delegar cada vez mais tarefas rotineiras à IA, libertando-os para trabalhos de maior valor.
Tejal Patwardhan, que lidera as avaliações, observa um progresso rápido: o GPT-4o obteve apenas 13,7% há quinze meses, enquanto o GPT-5 quase triplica esse desempenho – uma trajetória que deve continuar.
Embora benchmarks como o AIME 2025 e o GPQA Diamond dominem a avaliação de IA, muitos modelos se aproximam da saturação nestes testes acadêmicos. O GDPval representa uma ênfase crescente em padrões de avaliação práticos e relevantes para a indústria – embora a OpenAI exija testes mais abrangentes para demonstrar conclusivamente o desempenho de nível humano em domínios profissionais.
Artigo relacionado
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c
Recomendações de tópicos especiais relacionados
Comentários (0)
Na quinta-feira, a OpenAI apresentou o GDPval, um marco revolucionário que avalia como seus modelos de IA se comparam a profissionais humanos em diversos setores. Esta avaliação representa um passo inicial para medir se os sistemas da OpenAI podem superar humanos em trabalhos economicamente impactantes – um objetivo central na busca da empresa pela inteligência artificial geral (IAG).
De acordo com a OpenAI, tanto o GPT-5 quanto o Claude Opus 4.1 da Anthropic demonstram qualidade de saída aproximando-se da de especialistas do setor.
Embora essas descobertas não impliquem a substituição iminente de empregos humanos, elas representam um acompanhamento crucial do progresso. A OpenAI reconhece que o GDPval atualmente avalia apenas uma fração das tarefas profissionais do mundo real, contradizendo as previsões de alguns CEOs sobre uma disruptura generalizada da IA em alguns anos.
O GDPval avalia o desempenho em nove setores-chave do PIB dos EUA – incluindo saúde, finanças, manufatura e governo – testando 44 ocupações, desde engenharia de software até jornalismo.
Para o GDPval-v0, profissionais compararam relatórios gerados por IA com o trabalho de suas contrapartes humanas. Uma tarefa de exemplo envolveu banqueiros de investimento analisando panoramas de concorrentes de entrega de última milha versus versões de IA. A OpenAI calculou a "taxa de vitória" de cada modelo contra as saídas humanas em todas as ocupações.
O modelo aprimorado GPT-5-high igualou ou excedeu a saída de especialistas em 40,6% das vezes, enquanto o Claude Opus 4.1 atingiu uma taxa de paridade de 49% – a OpenAI sugere que essa pontuação mais alta pode refletir a apresentação visual superior do Claude,而非 uma vantagem substantiva.
Conecte-se com mais de 10.000 inovadores de tecnologia e VC no Disrupt 2025
Com Netflix, Box, a16z, ElevenLabs, Wayve, Sequoia Capital e Elad Gil entre mais de 250 líderes do setor hospedando mais de 200 sessões focadas em crescimento. Celebre o 20º aniversário da TechCrunch enquanto obtém insights competitivos dos principais pensadores da tecnologia. O registro antecipado antes de 26 de setembro economiza até US$ 668.
Conecte-se com mais de 10.000 inovadores de tecnologia e VC no Disrupt 2025
Com Netflix, Box, a16z, ElevenLabs, Wayve, Sequoia Capital e Elad Gil entre mais de 250 líderes do setor hospedando mais de 200 sessões focadas em crescimento. Celebre o 20º aniversário da TechCrunch enquanto obtém insights competitivos dos principais pensadores da tecnologia. O registro antecipado antes de 26 de setembro economiza até US$ 668.

A OpenAI reconhece o foco restrito do GDPval-v0 – atualmente testando apenas a geração de relatórios de pesquisa – e planeja iterações futuras avaliando interações mais amplas no local de trabalho.
O economista-chefe, Dr. Aaron Chatterji, disse à TechCrunch que esses resultados indicam que os profissionais podem delegar cada vez mais tarefas rotineiras à IA, libertando-os para trabalhos de maior valor.
Tejal Patwardhan, que lidera as avaliações, observa um progresso rápido: o GPT-4o obteve apenas 13,7% há quinze meses, enquanto o GPT-5 quase triplica esse desempenho – uma trajetória que deve continuar.
Embora benchmarks como o AIME 2025 e o GPQA Diamond dominem a avaliação de IA, muitos modelos se aproximam da saturação nestes testes acadêmicos. O GDPval representa uma ênfase crescente em padrões de avaliação práticos e relevantes para a indústria – embora a OpenAI exija testes mais abrangentes para demonstrar conclusivamente o desempenho de nível humano em domínios profissionais.
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c





Lar






