Lar
Lançamento do GPT-5 Enfrenta Desafios Enquanto OpenAI Lida com Obstáculos de Implementação

Atualizado em sexta-feira, 8 de agosto de 2025, 17:21 ET: Pouco depois da publicação deste artigo, Sam Altman, cofundador e CEO da OpenAI, confirmou que a empresa restauraria o acesso ao GPT-4o e a outros modelos legados para usuários selecionados, reconhecendo que o lançamento do GPT-5 foi "mais conturbado do que esperávamos".
Para dizer o mínimo, o tão aguardado lançamento do novo modelo da OpenAI, o GPT-5, teve um início conturbado.
Mesmo ignorando erros em gráficos e falhas na demonstração de voz da transmissão ao vivo de ontem (que introduziu quatro modelos distintos e um modo "Pensamento" disponível para três deles), vários relatos de usuários desde o lançamento mostram o GPT-5 com dificuldades em problemas relativamente simples que modelos anteriores da OpenAI – e sistemas rivais de outros laboratórios de IA – resolvem corretamente.
Por exemplo, o cientista de dados Colin Fraser compartilhou capturas de tela do GPT-5 lidando incorretamente com uma prova matemática – especificamente, se 8,888 repetindo é igual a 9 (não é).
Uau, eu só estava brincando antes, mas ele realmente é burro pic.twitter.com/ao51nOH0Ui
— Colin Fraser (@colin_fraser) 8 de agosto de 2025
Ele também falhou em uma simples equação aritmética, 5,9 = x + 5,11, um problema que muitos alunos do ensino fundamental conseguiriam resolver.
Isso é preocupante. https://t.co/PUbeCSgtRV
— Benjamin De Kraker (@BenjaminDEKR) 8 de agosto de 2025
Usar o GPT-5 para avaliar os próprios gráficos defeituosos da apresentação da OpenAI também não produziu respostas úteis ou precisas.
P. Prove que usar um LLM como juiz ainda não funciona
R. pic.twitter.com/KnCK5Xs9ja
— Kangwook Lee (@Kangwook_Lee) 7 de agosto de 2025
Além disso, ele tropeçou neste problema de palavras mais complicado (que, admito, até eu achei desafiador de início – embora a IA Grok 4, de Elon Musk, tenha respondido corretamente. Para uma dica, lembre-se de que as lajes não podem ser cortadas; todas as 80 devem permanecer intactas).
Cuidado para não se cortar na fronteira irregular pic.twitter.com/buJGgJ6baI
— Greg Burnham (@GregHBurnham) 8 de agosto de 2025
Em meus testes, o modelo mais antigo GPT-4o lidou com pelo menos um desses problemas de matemática de forma mais confiável. Infelizmente, a OpenAI está gradualmente eliminando esses modelos anteriores – incluindo o GPT-4o, que era o padrão anterior, e o modelo de raciocínio avançado o3 – para os usuários do ChatGPT, embora eles permaneçam acessíveis via API para desenvolvedores no curto prazo.
Desempenho em codificação fica abaixo dos benchmarks
Apesar dos benchmarks internos da OpenAI e de alguns testes de terceiros mostrarem o GPT-5 como o modelo de melhor desempenho para codificação, o uso no mundo real sugere que o Claude Opus 4.1, recentemente atualizado pela Anthropic, frequentemente lida com tarefas "one-shot" de forma mais eficaz – entregando a aplicação ou construção de software desejada pelo usuário conforme solicitado. Veja este exemplo do desenvolvedor Justin Sun, postado no X:
A tentativa one-shot do Opus 4.1 em "criar um zoológico de capivaras 3D para acariciar" – 8 minutos no total
Isso foi honestamente muito impressionante, não só as capivaras são muito mais fofas e se movem, há níveis individuais de afeição, um interruptor de dia/noite, alimentação, e até mesmo um recurso de captura de tela pic.twitter.com/FiKTO3FKK4
— justin (@justinsunyt) 7 de agosto de 2025
Além disso, um relatório da empresa de segurança SPLX revelou que as medidas de segurança internas da OpenAI tinham lacunas significativas em áreas como alinhamento comercial e suscetibilidade a ataques de injeção de prompt e de lógica ofuscada.
Embora anedótico, o feedback inicial de usuários avançados de IA sugere uma recepção geral morna.
O influenciador de IA e ex-funcionário do Google, Bilawal Sidhu, realizou uma enquete no X perguntando aos seguidores por uma "verificação de vibes". Com 172 votos até agora, a resposta predominante tem sido "Mais ou menos".
Certo, verificação de vibes do GPT-5
— Bilawal Sidhu (@bilawalsidhu) 7 de agosto de 2025
Como notou a conta pseudônima AI Leaks and News, "O consenso esmagador sobre o GPT-5, tanto no X quanto no AMA do Reddit, é esmagadoramente negativo."
O consenso esmagador sobre o GPT-5, tanto no X quanto no AMA do Reddit, é esmagadoramente negativo
A maioria dos usuários está descontente com o seletor de modelos quebrado e com os usuários não-pro não tendo acesso a modelos legados
Quais são seus pensamentos iniciais sobre o GPT-5?
— AI Leaks and News (@AILeaksAndNews) 8 de agosto de 2025
Tibor Blaho, engenheiro-chefe da AIPRM e um conhecido comentarista de IA no X, compilou um resumo completo dos problemas do lançamento do ChatGPT-5. Ele apontou que um dos recursos principais – um "roteador" automático que seleciona o modo pensante ou não pensante com base na complexidade da consulta – tornou-se uma das principais queixas, já que o modelo frequentemente usa o modo não pensante como padrão para muitos usuários.
Um pouco triste como o lançamento do GPT-5 está indo até agora, especialmente após a longa espera e as altas expectativas
– A alternância automática entre modelos (o roteador) parece parcialmente quebrada/não confiável
– Não está claro exatamente com qual modelo você está interagindo (standard ou mini,…
— Tibor Blaho (@btibor91) 8 de agosto de 2025
Concorrentes prontos para capitalizar
Como resultado, o sentimento em torno do ChatGPT-5 está longe de ser uniformemente positivo – representando um sério desafio para a OpenAI, já que a concorrência se intensifica com gigantes americanos como Google e Anthropic, e com uma crescente lista de modelos de linguagem grandes chineses gratuitos, de código aberto e capazes, oferecendo funcionalidades que muitos modelos americanos não possuem.
Considere a equipe de pesquisa da Alibaba Qwen, que hoje atualizou seu modelo de alto desempenho Qwen 3 para suportar 1 milhão de tokens de contexto. Isso permite que os usuários troquem quase quatro vezes mais informações por interação do que o GPT-5 oferece atualmente.
Com o outro grande lançamento da OpenAI esta semana – uma nova série de modelos de código aberto gpt-oss – também recebendo primeiras avaliações mistas, a perspectiva é incerta para a empresa dedicada líder em usuários (o ChatGPT agora conta com 700 milhões de usuários ativos semanais).
Esse sentimento é ecoado no mercado de previsão Polymarket, onde os usuários apostam maciçamente que o Google provavelmente terá o modelo de IA líder até o final de agosto de 2025.
Outros usuários avançados, como Matt Shumer, cofundador e CEO da Otherside AI – que teve acesso antecipado ao GPT-5 e publicou uma análise positiva – sugeriram que as opiniões podem mudar à medida que mais pessoas otimizam seus fluxos de trabalho para o novo modelo:
Muitas pessoas que estão tendo uma experiência ruim estão usando o GPT-5 em sistemas de agentes que ainda não estão otimizados para ele.
Para cada novo lançamento de modelo, há um intervalo de tempo entre o lançamento e o momento em que as empresas que integram o modelo o fazem funcionar bem de verdade.
As empresas de agentes correm para…
— Matt Shumer (@mattshumer_) 8 de agosto de 2025
Embora ainda seja cedo para o GPT-5 – e as opiniões podem mudar significativamente à medida que mais pessoas o testam em várias tarefas – os sinais iniciais sugerem que este não é o "grande sucesso" que lançamentos anteriores como GPT-4, GPT-4o ou o3 representaram. Esse é um sinal preocupante para uma empresa que recentemente garantiu outra rodada de financiamento, mas permanece sem lucros devido aos altos gastos com P&D.
Artigo relacionado
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c
Recomendações de tópicos especiais relacionados
Comentários (1)

Atualizado em sexta-feira, 8 de agosto de 2025, 17:21 ET: Pouco depois da publicação deste artigo, Sam Altman, cofundador e CEO da OpenAI, confirmou que a empresa restauraria o acesso ao GPT-4o e a outros modelos legados para usuários selecionados, reconhecendo que o lançamento do GPT-5 foi "mais conturbado do que esperávamos".
Para dizer o mínimo, o tão aguardado lançamento do novo modelo da OpenAI, o GPT-5, teve um início conturbado.
Mesmo ignorando erros em gráficos e falhas na demonstração de voz da transmissão ao vivo de ontem (que introduziu quatro modelos distintos e um modo "Pensamento" disponível para três deles), vários relatos de usuários desde o lançamento mostram o GPT-5 com dificuldades em problemas relativamente simples que modelos anteriores da OpenAI – e sistemas rivais de outros laboratórios de IA – resolvem corretamente.
Por exemplo, o cientista de dados Colin Fraser compartilhou capturas de tela do GPT-5 lidando incorretamente com uma prova matemática – especificamente, se 8,888 repetindo é igual a 9 (não é).
Uau, eu só estava brincando antes, mas ele realmente é burro pic.twitter.com/ao51nOH0Ui
— Colin Fraser (@colin_fraser) 8 de agosto de 2025
Ele também falhou em uma simples equação aritmética, 5,9 = x + 5,11, um problema que muitos alunos do ensino fundamental conseguiriam resolver.
Isso é preocupante. https://t.co/PUbeCSgtRV
— Benjamin De Kraker (@BenjaminDEKR) 8 de agosto de 2025
Usar o GPT-5 para avaliar os próprios gráficos defeituosos da apresentação da OpenAI também não produziu respostas úteis ou precisas.
P. Prove que usar um LLM como juiz ainda não funciona
— Kangwook Lee (@Kangwook_Lee) 7 de agosto de 2025
R. pic.twitter.com/KnCK5Xs9ja
Além disso, ele tropeçou neste problema de palavras mais complicado (que, admito, até eu achei desafiador de início – embora a IA Grok 4, de Elon Musk, tenha respondido corretamente. Para uma dica, lembre-se de que as lajes não podem ser cortadas; todas as 80 devem permanecer intactas).
Cuidado para não se cortar na fronteira irregular pic.twitter.com/buJGgJ6baI
— Greg Burnham (@GregHBurnham) 8 de agosto de 2025
Em meus testes, o modelo mais antigo GPT-4o lidou com pelo menos um desses problemas de matemática de forma mais confiável. Infelizmente, a OpenAI está gradualmente eliminando esses modelos anteriores – incluindo o GPT-4o, que era o padrão anterior, e o modelo de raciocínio avançado o3 – para os usuários do ChatGPT, embora eles permaneçam acessíveis via API para desenvolvedores no curto prazo.
Desempenho em codificação fica abaixo dos benchmarks
Apesar dos benchmarks internos da OpenAI e de alguns testes de terceiros mostrarem o GPT-5 como o modelo de melhor desempenho para codificação, o uso no mundo real sugere que o Claude Opus 4.1, recentemente atualizado pela Anthropic, frequentemente lida com tarefas "one-shot" de forma mais eficaz – entregando a aplicação ou construção de software desejada pelo usuário conforme solicitado. Veja este exemplo do desenvolvedor Justin Sun, postado no X:
A tentativa one-shot do Opus 4.1 em "criar um zoológico de capivaras 3D para acariciar" – 8 minutos no total
— justin (@justinsunyt) 7 de agosto de 2025
Isso foi honestamente muito impressionante, não só as capivaras são muito mais fofas e se movem, há níveis individuais de afeição, um interruptor de dia/noite, alimentação, e até mesmo um recurso de captura de tela pic.twitter.com/FiKTO3FKK4
Além disso, um relatório da empresa de segurança SPLX revelou que as medidas de segurança internas da OpenAI tinham lacunas significativas em áreas como alinhamento comercial e suscetibilidade a ataques de injeção de prompt e de lógica ofuscada.
Embora anedótico, o feedback inicial de usuários avançados de IA sugere uma recepção geral morna.
O influenciador de IA e ex-funcionário do Google, Bilawal Sidhu, realizou uma enquete no X perguntando aos seguidores por uma "verificação de vibes". Com 172 votos até agora, a resposta predominante tem sido "Mais ou menos".
Certo, verificação de vibes do GPT-5
— Bilawal Sidhu (@bilawalsidhu) 7 de agosto de 2025
Como notou a conta pseudônima AI Leaks and News, "O consenso esmagador sobre o GPT-5, tanto no X quanto no AMA do Reddit, é esmagadoramente negativo."
O consenso esmagador sobre o GPT-5, tanto no X quanto no AMA do Reddit, é esmagadoramente negativo
— AI Leaks and News (@AILeaksAndNews) 8 de agosto de 2025
A maioria dos usuários está descontente com o seletor de modelos quebrado e com os usuários não-pro não tendo acesso a modelos legados
Quais são seus pensamentos iniciais sobre o GPT-5?
Tibor Blaho, engenheiro-chefe da AIPRM e um conhecido comentarista de IA no X, compilou um resumo completo dos problemas do lançamento do ChatGPT-5. Ele apontou que um dos recursos principais – um "roteador" automático que seleciona o modo pensante ou não pensante com base na complexidade da consulta – tornou-se uma das principais queixas, já que o modelo frequentemente usa o modo não pensante como padrão para muitos usuários.
Um pouco triste como o lançamento do GPT-5 está indo até agora, especialmente após a longa espera e as altas expectativas
— Tibor Blaho (@btibor91) 8 de agosto de 2025
– A alternância automática entre modelos (o roteador) parece parcialmente quebrada/não confiável
– Não está claro exatamente com qual modelo você está interagindo (standard ou mini,…
Concorrentes prontos para capitalizar
Como resultado, o sentimento em torno do ChatGPT-5 está longe de ser uniformemente positivo – representando um sério desafio para a OpenAI, já que a concorrência se intensifica com gigantes americanos como Google e Anthropic, e com uma crescente lista de modelos de linguagem grandes chineses gratuitos, de código aberto e capazes, oferecendo funcionalidades que muitos modelos americanos não possuem.
Considere a equipe de pesquisa da Alibaba Qwen, que hoje atualizou seu modelo de alto desempenho Qwen 3 para suportar 1 milhão de tokens de contexto. Isso permite que os usuários troquem quase quatro vezes mais informações por interação do que o GPT-5 oferece atualmente.
Com o outro grande lançamento da OpenAI esta semana – uma nova série de modelos de código aberto gpt-oss – também recebendo primeiras avaliações mistas, a perspectiva é incerta para a empresa dedicada líder em usuários (o ChatGPT agora conta com 700 milhões de usuários ativos semanais).
Esse sentimento é ecoado no mercado de previsão Polymarket, onde os usuários apostam maciçamente que o Google provavelmente terá o modelo de IA líder até o final de agosto de 2025.
Outros usuários avançados, como Matt Shumer, cofundador e CEO da Otherside AI – que teve acesso antecipado ao GPT-5 e publicou uma análise positiva – sugeriram que as opiniões podem mudar à medida que mais pessoas otimizam seus fluxos de trabalho para o novo modelo:
Muitas pessoas que estão tendo uma experiência ruim estão usando o GPT-5 em sistemas de agentes que ainda não estão otimizados para ele.
— Matt Shumer (@mattshumer_) 8 de agosto de 2025
Para cada novo lançamento de modelo, há um intervalo de tempo entre o lançamento e o momento em que as empresas que integram o modelo o fazem funcionar bem de verdade.
As empresas de agentes correm para…
Embora ainda seja cedo para o GPT-5 – e as opiniões podem mudar significativamente à medida que mais pessoas o testam em várias tarefas – os sinais iniciais sugerem que este não é o "grande sucesso" que lançamentos anteriores como GPT-4, GPT-4o ou o3 representaram. Esse é um sinal preocupante para uma empresa que recentemente garantiu outra rodada de financiamento, mas permanece sem lucros devido aos altos gastos com P&D.
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c











