OpenAI lança as versões GPT-5.4 Pro e Thinking

Na quinta-feira, a OpenAI apresentou o GPT-5.4, um novo modelo de base descrito como “nosso modelo de ponta mais capaz e eficiente para trabalhos profissionais”. Além da versão padrão, o GPT-5.4 é oferecido como uma variante focada no raciocínio (GPT-5.4 Thinking) e uma edição com desempenho otimizado (GPT-5.4 Pro).
A versão API do modelo suportará janelas de contexto de até 1 milhão de tokens, marcando a maior capacidade de contexto que a OpenAI já ofereceu.
A OpenAI também destacou a eficiência aprimorada de tokens, observando que o GPT-5.4 pode resolver problemas idênticos usando significativamente menos tokens do que seu antecessor.
O novo modelo apresenta resultados de benchmark substancialmente melhores, alcançando pontuações recordes nos benchmarks de uso de computador OSWorld-Verified e WebArena Verified. Ele também estabeleceu um novo recorde com uma pontuação de 83% no teste GDPval da OpenAI para tarefas de trabalho intelectual.
De acordo com uma declaração do CEO da Mercor, Brendan Foody, o GPT-5.4 lidera o benchmark APEX-Agents da Mercor, que avalia habilidades profissionais nas áreas de direito e finanças.
“[O GPT-5.4] se destaca na produção de resultados de longo prazo, como apresentações de slides, modelos financeiros e análises jurídicas”, afirmou Foody, “oferecendo desempenho de ponta ao operar mais rapidamente e a um custo menor do que os modelos de ponta concorrentes”.
O GPT-5.4 dá continuidade ao trabalho da OpenAI para reduzir alucinações e imprecisões factuais. A empresa informa que o novo modelo tem 33% menos probabilidade de cometer erros em afirmações individuais em comparação com o GPT-5.2, com as respostas gerais tendo 18% menos probabilidade de conter erros.
Como parte do lançamento, a OpenAI redesenhou a forma como a API do GPT-5.4 lida com a chamada de ferramentas, introduzindo um novo sistema chamado Tool Search. Anteriormente, os prompts do sistema precisavam definir todas as ferramentas disponíveis antecipadamente — um processo que consumia tokens consideráveis à medida que as bibliotecas de ferramentas se expandiam. O novo sistema permite que os modelos recuperem definições de ferramentas sob demanda, tornando as solicitações mais rápidas e econômicas em ambientes com muitas ferramentas.
A OpenAI também adicionou uma nova avaliação de segurança para analisar a cadeia de pensamento de seus modelos — o comentário contínuo que revela o raciocínio do modelo durante tarefas de várias etapas. Pesquisadores de segurança em IA há muito expressam preocupação de que modelos de raciocínio possam deturpar sua cadeia de pensamento, e os testes confirmam que isso pode ocorrer sob certas condições.
A nova avaliação da OpenAI indica que o engano é menos provável na versão Thinking do GPT-5.4, “sugerindo que o modelo não tem a capacidade de ocultar seu raciocínio e que o monitoramento da CoT continua sendo uma ferramenta de segurança eficaz”.
Artigo relacionado
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c
Recomendações de tópicos especiais relacionados
Comentários (0)

Na quinta-feira, a OpenAI apresentou o GPT-5.4, um novo modelo de base descrito como “nosso modelo de ponta mais capaz e eficiente para trabalhos profissionais”. Além da versão padrão, o GPT-5.4 é oferecido como uma variante focada no raciocínio (GPT-5.4 Thinking) e uma edição com desempenho otimizado (GPT-5.4 Pro).
A versão API do modelo suportará janelas de contexto de até 1 milhão de tokens, marcando a maior capacidade de contexto que a OpenAI já ofereceu.
A OpenAI também destacou a eficiência aprimorada de tokens, observando que o GPT-5.4 pode resolver problemas idênticos usando significativamente menos tokens do que seu antecessor.
O novo modelo apresenta resultados de benchmark substancialmente melhores, alcançando pontuações recordes nos benchmarks de uso de computador OSWorld-Verified e WebArena Verified. Ele também estabeleceu um novo recorde com uma pontuação de 83% no teste GDPval da OpenAI para tarefas de trabalho intelectual.
De acordo com uma declaração do CEO da Mercor, Brendan Foody, o GPT-5.4 lidera o benchmark APEX-Agents da Mercor, que avalia habilidades profissionais nas áreas de direito e finanças.
“[O GPT-5.4] se destaca na produção de resultados de longo prazo, como apresentações de slides, modelos financeiros e análises jurídicas”, afirmou Foody, “oferecendo desempenho de ponta ao operar mais rapidamente e a um custo menor do que os modelos de ponta concorrentes”.
O GPT-5.4 dá continuidade ao trabalho da OpenAI para reduzir alucinações e imprecisões factuais. A empresa informa que o novo modelo tem 33% menos probabilidade de cometer erros em afirmações individuais em comparação com o GPT-5.2, com as respostas gerais tendo 18% menos probabilidade de conter erros.
Como parte do lançamento, a OpenAI redesenhou a forma como a API do GPT-5.4 lida com a chamada de ferramentas, introduzindo um novo sistema chamado Tool Search. Anteriormente, os prompts do sistema precisavam definir todas as ferramentas disponíveis antecipadamente — um processo que consumia tokens consideráveis à medida que as bibliotecas de ferramentas se expandiam. O novo sistema permite que os modelos recuperem definições de ferramentas sob demanda, tornando as solicitações mais rápidas e econômicas em ambientes com muitas ferramentas.
A OpenAI também adicionou uma nova avaliação de segurança para analisar a cadeia de pensamento de seus modelos — o comentário contínuo que revela o raciocínio do modelo durante tarefas de várias etapas. Pesquisadores de segurança em IA há muito expressam preocupação de que modelos de raciocínio possam deturpar sua cadeia de pensamento, e os testes confirmam que isso pode ocorrer sob certas condições.
A nova avaliação da OpenAI indica que o engano é menos provável na versão Thinking do GPT-5.4, “sugerindo que o modelo não tem a capacidade de ocultar seu raciocínio e que o monitoramento da CoT continua sendo uma ferramenta de segurança eficaz”.
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c





Lar






