O OpenAI lança GPT-4.5 'Orion': seu maior modelo de IA até o momento
Atualizado às 14:40 PT: Apenas horas após o lançamento do GPT-4.5, o OpenAI fez uma edição silenciosa no white paper do modelo de IA. Eles removeram uma linha afirmando que "o GPT-4.5 não é um modelo de IA de fronteira". Você ainda pode acessar o papel branco original aqui. Abaixo está o artigo original.
Na quinta-feira, o Openai recuou a cortina no GPT-4.5, o tão esperado modelo de IA que passa pelo nome do código Orion. Este mais recente gigante do OpenAI foi treinado com uma quantidade sem precedentes de poder de computação e dados, diferenciando -o de seus antecessores.
Apesar de sua escala impressionante, o White Paper da Openai afirmou inicialmente que eles não consideraram o GPT-4.5 um modelo de fronteira. No entanto, essa afirmação foi removida desde então, deixando -nos pensar sobre o verdadeiro potencial do modelo.
A partir de quinta-feira, os assinantes do ChatGpt Pro, o serviço premium de US $ 200 por mês da OpenAI, terão um primeiro gosto do GPT-4.5 como parte de uma prévia da pesquisa. Os desenvolvedores nas camadas de API pagas da OpenAI podem começar a usar o GPT-4.5 hoje, enquanto aqueles com assinaturas de equipes ChatGPT Plus e ChatGPT devem esperar acesso no momento da próxima semana, de acordo com um porta-voz do Openai.
O mundo da tecnologia está zumbindo sobre Orion, vendo -o como um teste sobre se os métodos tradicionais de treinamento de IA ainda mantêm água. O GPT-4.5 segue o mesmo manual que seus antecessores, contando com um aumento maciço no poder de computação e nos dados durante uma fase de aprendizado não supervisionada chamada pré-treinamento.
No passado, a dimensionamento levou a saltos significativos em vários domínios, como matemática, escrita e codificação. O Openai afirma que o tamanho do GPT-4.5 o doou com "um conhecimento mundial mais profundo" e "maior inteligência emocional". No entanto, há dicas de que os retornos da expansão podem estar diminuindo. Em vários benchmarks de IA, o GPT-4.5 fica por trás de modelos de raciocínio mais recentes de empresas como Deepseek, Anthropic e até OpenAI.
Além disso, a execução do GPT-4.5 vem com um preço alto. O OpenAI admite que é tão caro que eles estão considerando que o mantém disponível através da API a longo prazo. Os desenvolvedores pagarão US $ 75 por cada milhão de tokens de entrada e US $ 150 por cada milhão de tokens de produção, um forte contraste com o GPT-4O mais acessível, que custa apenas US $ 2,50 por milhão de tokens de entrada e tokens de produção de US $ 10 por milhão.
"Estamos compartilhando o GPT - 4.5 como uma prévia de pesquisa para entender melhor seus pontos fortes e limitações", compartilhou o OpenAI em uma postagem no blog. "Ainda estamos explorando todo o seu potencial e estamos animados para ver como as pessoas o usarão de maneiras inesperadas".
Desempenho misto
O Openai está claro que o GPT-4.5 não deve substituir o GPT-4O, seu modelo de cavalo de batalha que impulsiona a maior parte de sua API e ChatGPT. Embora o GPT-4.5 possa lidar com uploads de arquivo e imagem e usar a ferramenta de tela do ChatGPT, atualmente não suporta recursos como o modo de voz bidirecional realista do ChatGPT.
Pelo lado positivo, o GPT-4.5 supera o GPT-4O e muitos outros modelos no benchmark SimpleQA do OpenAI, que testa modelos de IA em perguntas factuais diretas. O OpenAI também afirma que o GPT-4.5 alucina com menos frequência do que a maioria dos modelos, o que teoricamente deve tornar menos provável de fabricar informações.
Curiosamente, o OpenAI não incluiu um de seus modelos de raciocínio com melhor desempenho, pesquisa profunda, nos resultados do SimpleQA. Um porta -voz do Openai disse ao TechCrunch que eles não relataram publicamente o desempenho da Deep Research nesse benchmark e não o considera uma comparação relevante. No entanto, o profundo modelo de pesquisa da Perplexity, que tem um desempenho semelhante à profunda pesquisa da Openai sobre outros parâmetros de referência, realmente supera o GPT-4.5 sobre esse teste de precisão factual.

Simpleqa benchmarks.image Créditos: OpenAI Em um subconjunto de problemas de codificação da referência verificada do SWE-BEMCH, o GPT-4.5 tem um desempenho semelhante ao GPT-4O e O3-Mini, mas fica aquém da profunda pesquisa da Openai e do soneto Claude 3,7 do Anthropic. Em outro teste de codificação, o SWE-Lancer Benchmark da OpenAI, que mede a capacidade de um modelo de IA de desenvolver recursos completos de software, o GPT-4.5 supera o GPT-4O e o O3-mini, mas não supera a pesquisa profunda.

Benchmark verificado do SWE do Openai. 
Diamond Benchmark de Diamond de Openai. Embora o GPT-4.5 não corresponda ao desempenho de liderar modelos de raciocínio de IA como O3-mini, R1 de Deepseek e Claude 3,7 sonetos em desafiar os benchmarks acadêmicos como AIME e GPQA, ele se mantém contra liderar modelos que não sejam de rendimento nos mesmos testes. Isso sugere que o GPT-4.5 se destaca em tarefas relacionadas à matemática e ciências.
O Openai também possui que o GPT-4.5 é qualitativamente superior a outros modelos em áreas que os benchmarks não capturam bem, como entender a intenção humana. Eles afirmam que o GPT-4.5 responde em um tom mais quente e mais natural e tem um bom desempenho em tarefas criativas, como escrever e design.
Em um teste informal, o OpenAI pediu ao GPT-4.5 e dois outros modelos, GPT-4O e O3-mini, para criar um unicórnio no formato SVG. Somente o GPT-4.5 conseguiu produzir algo parecido com um unicórnio.

Esquerda: GPT-4.5, Middle: GPT-4O, à direita: O3-mini.image Créditos: Openai Em outro teste, o Openai levou o GPT-4.5 e os outros modelos a responder ao aviso: "Estou passando por um momento difícil depois de falhar em um teste". Enquanto o GPT-4O e O3-mini forneceram informações úteis, a resposta do GPT-4.5 foi a mais socialmente apropriada.
"Estamos ansiosos para obter uma imagem mais completa dos recursos do GPT-4.5 através deste lançamento", escreveu o Openai em seu post no blog, "porque reconhecemos que os benchmarks acadêmicos nem sempre refletem a utilidade do mundo real".

Inteligência emocional do GPT-4.5 em ação. As leis de escala desafiaram
O Openai afirma que o GPT - 4,5 está "na fronteira do que é possível no aprendizado sem supervisão". No entanto, suas limitações parecem apoiar a crescente suspeita entre os especialistas de que as chamadas leis de escala de pré-treinamento podem estar atingindo seus limites.
Ilya Sutskever, co-fundadora e ex-cientista do Openai, afirmou em dezembro que "alcançamos os dados de pico" e que "o pré-treinamento como sabemos que ele terminará inquestionavelmente". Seus comentários ecoaram as preocupações compartilhadas por investidores, fundadores e pesquisadores da IA com TechCrunch em novembro.
Em resposta a esses desafios, o setor - incluindo o OpenAI - recorreu a modelos de raciocínio, que levam mais tempo para executar tarefas, mas oferecem resultados mais consistentes. Ao permitir modelos de raciocínio mais tempo e poder de computação para "pensar" por meio de problemas, os laboratórios da IA acreditam que podem aprimorar significativamente os recursos do modelo.
A Openai planeja finalmente fundir sua série GPT com sua série de raciocínio "O", começando com o GPT-5 ainda este ano. Apesar de seus altos custos de treinamento, atrasos e expectativas internas não atendidas, o GPT-4.5 pode não reivindicar a coroa de referência da IA por conta própria. Mas o Openai provavelmente o vê como um passo crucial em direção a algo muito mais poderoso.
Artigo relacionado
OpenAI Enhances AI Model Behind Its Operator Agent
OpenAI Takes Operator to the Next LevelOpenAI is giving its autonomous AI agent, Operator, a major upgrade. The upcoming changes mean Operator will soon rely on a model based on o3
OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied
Why Benchmark Discrepancies Matter in AIWhen it comes to AI, numbers often tell the story—and sometimes, those numbers don’t quite add up. Take OpenAI’s o3 model, for instance. The
DeepSeek AI Challenges ChatGPT and Shapes the Future of AI
The Rise of DeepSeek AI: A New Chapter in the AI LandscapeArtificial intelligence is in a constant state of flux, with new entrants challenging the status quo every day. Among these, DeepSeek AI has emerged as a notable contender, particularly after surpassing ChatGPT in app store downloads. This mi
Comentários (50)
0/200
GregoryBaker
10 de Abril de 2025 à0 00:00:00 GMT
GPT-4.5 'Orion' is impressive, but the quiet edit to the white paper was shady. It's like they're trying to hide something. Still, the model's performance is top-notch, just wish they were more transparent.
0
NicholasSanchez
10 de Abril de 2025 à0 00:00:00 GMT
GPT-4.5 'Orion'は印象的ですが、ホワイトペーパーの静かな編集は怪しいです。何かを隠そうとしているようです。それでも、モデルのパフォーマンスは最高です。もう少し透明性が欲しいですね。
0
JasonJohnson
10 de Abril de 2025 à0 00:00:00 GMT
GPT-4.5 'Orion'은 인상적이지만, 백서의 조용한 수정은 수상쩍어요. 뭔가를 숨기려는 것 같아요. 그래도 모델의 성능은 최고예요. 좀 더 투명했으면 좋겠어요.
0
JasonAnderson
10 de Abril de 2025 à0 00:00:00 GMT
GPT-4.5 'Orion' é impressionante, mas a edição silenciosa do white paper foi suspeita. Parece que estão tentando esconder algo. Ainda assim, o desempenho do modelo é de primeira linha, só desejo que fossem mais transparentes.
0
AvaHill
10 de Abril de 2025 à0 00:00:00 GMT
GPT-4.5 'Orion' es impresionante, pero la edición silenciosa del white paper fue sospechosa. Parece que están tratando de ocultar algo. Aún así, el rendimiento del modelo es de primera, solo desearía que fueran más transparentes.
0
KennethMartin
10 de Abril de 2025 à0 00:00:00 GMT
GPT-4.5 'Orion' is massive, but the quiet edit to the white paper was shady. Why remove the 'not a frontier AI model' line? It's still a beast of a model, but the sneakiness is a bit off-putting. Transparency, please!
0
Atualizado às 14:40 PT: Apenas horas após o lançamento do GPT-4.5, o OpenAI fez uma edição silenciosa no white paper do modelo de IA. Eles removeram uma linha afirmando que "o GPT-4.5 não é um modelo de IA de fronteira". Você ainda pode acessar o papel branco original aqui. Abaixo está o artigo original.
Na quinta-feira, o Openai recuou a cortina no GPT-4.5, o tão esperado modelo de IA que passa pelo nome do código Orion. Este mais recente gigante do OpenAI foi treinado com uma quantidade sem precedentes de poder de computação e dados, diferenciando -o de seus antecessores.
Apesar de sua escala impressionante, o White Paper da Openai afirmou inicialmente que eles não consideraram o GPT-4.5 um modelo de fronteira. No entanto, essa afirmação foi removida desde então, deixando -nos pensar sobre o verdadeiro potencial do modelo.
A partir de quinta-feira, os assinantes do ChatGpt Pro, o serviço premium de US $ 200 por mês da OpenAI, terão um primeiro gosto do GPT-4.5 como parte de uma prévia da pesquisa. Os desenvolvedores nas camadas de API pagas da OpenAI podem começar a usar o GPT-4.5 hoje, enquanto aqueles com assinaturas de equipes ChatGPT Plus e ChatGPT devem esperar acesso no momento da próxima semana, de acordo com um porta-voz do Openai.
O mundo da tecnologia está zumbindo sobre Orion, vendo -o como um teste sobre se os métodos tradicionais de treinamento de IA ainda mantêm água. O GPT-4.5 segue o mesmo manual que seus antecessores, contando com um aumento maciço no poder de computação e nos dados durante uma fase de aprendizado não supervisionada chamada pré-treinamento.
No passado, a dimensionamento levou a saltos significativos em vários domínios, como matemática, escrita e codificação. O Openai afirma que o tamanho do GPT-4.5 o doou com "um conhecimento mundial mais profundo" e "maior inteligência emocional". No entanto, há dicas de que os retornos da expansão podem estar diminuindo. Em vários benchmarks de IA, o GPT-4.5 fica por trás de modelos de raciocínio mais recentes de empresas como Deepseek, Anthropic e até OpenAI.
Além disso, a execução do GPT-4.5 vem com um preço alto. O OpenAI admite que é tão caro que eles estão considerando que o mantém disponível através da API a longo prazo. Os desenvolvedores pagarão US $ 75 por cada milhão de tokens de entrada e US $ 150 por cada milhão de tokens de produção, um forte contraste com o GPT-4O mais acessível, que custa apenas US $ 2,50 por milhão de tokens de entrada e tokens de produção de US $ 10 por milhão.
"Estamos compartilhando o GPT - 4.5 como uma prévia de pesquisa para entender melhor seus pontos fortes e limitações", compartilhou o OpenAI em uma postagem no blog. "Ainda estamos explorando todo o seu potencial e estamos animados para ver como as pessoas o usarão de maneiras inesperadas".
Desempenho misto
O Openai está claro que o GPT-4.5 não deve substituir o GPT-4O, seu modelo de cavalo de batalha que impulsiona a maior parte de sua API e ChatGPT. Embora o GPT-4.5 possa lidar com uploads de arquivo e imagem e usar a ferramenta de tela do ChatGPT, atualmente não suporta recursos como o modo de voz bidirecional realista do ChatGPT.
Pelo lado positivo, o GPT-4.5 supera o GPT-4O e muitos outros modelos no benchmark SimpleQA do OpenAI, que testa modelos de IA em perguntas factuais diretas. O OpenAI também afirma que o GPT-4.5 alucina com menos frequência do que a maioria dos modelos, o que teoricamente deve tornar menos provável de fabricar informações.
Curiosamente, o OpenAI não incluiu um de seus modelos de raciocínio com melhor desempenho, pesquisa profunda, nos resultados do SimpleQA. Um porta -voz do Openai disse ao TechCrunch que eles não relataram publicamente o desempenho da Deep Research nesse benchmark e não o considera uma comparação relevante. No entanto, o profundo modelo de pesquisa da Perplexity, que tem um desempenho semelhante à profunda pesquisa da Openai sobre outros parâmetros de referência, realmente supera o GPT-4.5 sobre esse teste de precisão factual.
O Openai também possui que o GPT-4.5 é qualitativamente superior a outros modelos em áreas que os benchmarks não capturam bem, como entender a intenção humana. Eles afirmam que o GPT-4.5 responde em um tom mais quente e mais natural e tem um bom desempenho em tarefas criativas, como escrever e design.
Em um teste informal, o OpenAI pediu ao GPT-4.5 e dois outros modelos, GPT-4O e O3-mini, para criar um unicórnio no formato SVG. Somente o GPT-4.5 conseguiu produzir algo parecido com um unicórnio.
"Estamos ansiosos para obter uma imagem mais completa dos recursos do GPT-4.5 através deste lançamento", escreveu o Openai em seu post no blog, "porque reconhecemos que os benchmarks acadêmicos nem sempre refletem a utilidade do mundo real".

Inteligência emocional do GPT-4.5 em ação. As leis de escala desafiaram
O Openai afirma que o GPT - 4,5 está "na fronteira do que é possível no aprendizado sem supervisão". No entanto, suas limitações parecem apoiar a crescente suspeita entre os especialistas de que as chamadas leis de escala de pré-treinamento podem estar atingindo seus limites.
Ilya Sutskever, co-fundadora e ex-cientista do Openai, afirmou em dezembro que "alcançamos os dados de pico" e que "o pré-treinamento como sabemos que ele terminará inquestionavelmente". Seus comentários ecoaram as preocupações compartilhadas por investidores, fundadores e pesquisadores da IA com TechCrunch em novembro.
Em resposta a esses desafios, o setor - incluindo o OpenAI - recorreu a modelos de raciocínio, que levam mais tempo para executar tarefas, mas oferecem resultados mais consistentes. Ao permitir modelos de raciocínio mais tempo e poder de computação para "pensar" por meio de problemas, os laboratórios da IA acreditam que podem aprimorar significativamente os recursos do modelo.
A Openai planeja finalmente fundir sua série GPT com sua série de raciocínio "O", começando com o GPT-5 ainda este ano. Apesar de seus altos custos de treinamento, atrasos e expectativas internas não atendidas, o GPT-4.5 pode não reivindicar a coroa de referência da IA por conta própria. Mas o Openai provavelmente o vê como um passo crucial em direção a algo muito mais poderoso.




GPT-4.5 'Orion' is impressive, but the quiet edit to the white paper was shady. It's like they're trying to hide something. Still, the model's performance is top-notch, just wish they were more transparent.




GPT-4.5 'Orion'は印象的ですが、ホワイトペーパーの静かな編集は怪しいです。何かを隠そうとしているようです。それでも、モデルのパフォーマンスは最高です。もう少し透明性が欲しいですね。




GPT-4.5 'Orion'은 인상적이지만, 백서의 조용한 수정은 수상쩍어요. 뭔가를 숨기려는 것 같아요. 그래도 모델의 성능은 최고예요. 좀 더 투명했으면 좋겠어요.




GPT-4.5 'Orion' é impressionante, mas a edição silenciosa do white paper foi suspeita. Parece que estão tentando esconder algo. Ainda assim, o desempenho do modelo é de primeira linha, só desejo que fossem mais transparentes.




GPT-4.5 'Orion' es impresionante, pero la edición silenciosa del white paper fue sospechosa. Parece que están tratando de ocultar algo. Aún así, el rendimiento del modelo es de primera, solo desearía que fueran más transparentes.




GPT-4.5 'Orion' is massive, but the quiet edit to the white paper was shady. Why remove the 'not a frontier AI model' line? It's still a beast of a model, but the sneakiness is a bit off-putting. Transparency, please!












