OpenAI dévoile les versions GPT-5.4 Pro et Thinking

Jeudi, OpenAI a présenté GPT-5.4, un nouveau modèle de base décrit comme « notre modèle de pointe le plus performant et le plus efficace pour les tâches professionnelles ». Outre la version standard, GPT-5.4 est proposé dans une variante axée sur le raisonnement (GPT-5.4 Thinking) et une édition optimisée pour les performances (GPT-5.4 Pro).
La version API du modèle prendra en charge des fenêtres de contexte pouvant contenir jusqu'à 1 million de tokens, ce qui représente la plus grande capacité de contexte jamais proposée par OpenAI.
OpenAI a également mis en avant une efficacité améliorée en termes de tokens, soulignant que GPT-5.4 peut résoudre des problèmes identiques en utilisant nettement moins de tokens que son prédécesseur.
Le nouveau modèle affiche des résultats de benchmark nettement améliorés, atteignant des scores records sur les benchmarks d'utilisation informatique OSWorld-Verified et WebArena Verified. Il a également établi un nouveau record avec un score de 83 % au test GDPval d'OpenAI pour les tâches de travail intellectuel.
Selon une déclaration du PDG de Mercor, Brendan Foody, GPT-5.4 arrive en tête du benchmark APEX-Agents de Mercor, qui évalue les compétences professionnelles en droit et en finance.
« [GPT-5.4] excelle dans la production de livrables à long terme tels que des présentations PowerPoint, des modèles financiers et des analyses juridiques », a déclaré M. Foody, « offrant des performances de premier ordre tout en fonctionnant plus rapidement et à moindre coût que les modèles de pointe concurrents. »
GPT-5.4 s'inscrit dans la continuité des efforts d'OpenAI visant à réduire les hallucinations et les inexactitudes factuelles. L'entreprise indique que le nouveau modèle est 33 % moins susceptible de commettre des erreurs dans les affirmations individuelles par rapport à GPT-5.2, et que ses réponses globales sont 18 % moins susceptibles de contenir des erreurs.
Dans le cadre de ce lancement, OpenAI a repensé la manière dont l’API GPT-5.4 gère l’appel des outils, en introduisant un nouveau système appelé Tool Search. Auparavant, les invites du système devaient définir tous les outils disponibles à l’avance — un processus qui consommait un nombre considérable de jetons à mesure que les bibliothèques d’outils s’étoffaient. Le nouveau système permet aux modèles de récupérer les définitions des outils à la demande, rendant les requêtes plus rapides et plus rentables dans les environnements comportant de nombreux outils.
OpenAI a également ajouté une nouvelle évaluation de sécurité pour analyser la chaîne de pensée de ses modèles — le commentaire en continu qui révèle le raisonnement du modèle lors de tâches en plusieurs étapes. Les chercheurs en sécurité de l'IA s'inquiètent depuis longtemps du fait que les modèles de raisonnement puissent déformer leur chaîne de pensée, et les tests confirment que cela peut se produire dans certaines conditions.
La nouvelle évaluation d'OpenAI indique que la tromperie est moins probable dans la version Thinking de GPT-5.4, « ce qui suggère que le modèle n'a pas la capacité de dissimuler son raisonnement et que la surveillance de la chaîne de pensée reste un outil de sécurité efficace ».
Article connexe
Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI
Mercredi, un analyste de Wall Street a demandé directement au PDG de Microsoft, Satya Nadella, en quoi le nouveau partenariat avec OpenAI affecterait les résultats financiers de l’entreprise.Nadella a décrit ce nouvel accord comme une victoire pour
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours
Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Greg Brockman révèle comment Elon Musk a quitté OpenAI
Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc
Recommandations de sujets spéciaux liés
commentaires (0)

Jeudi, OpenAI a présenté GPT-5.4, un nouveau modèle de base décrit comme « notre modèle de pointe le plus performant et le plus efficace pour les tâches professionnelles ». Outre la version standard, GPT-5.4 est proposé dans une variante axée sur le raisonnement (GPT-5.4 Thinking) et une édition optimisée pour les performances (GPT-5.4 Pro).
La version API du modèle prendra en charge des fenêtres de contexte pouvant contenir jusqu'à 1 million de tokens, ce qui représente la plus grande capacité de contexte jamais proposée par OpenAI.
OpenAI a également mis en avant une efficacité améliorée en termes de tokens, soulignant que GPT-5.4 peut résoudre des problèmes identiques en utilisant nettement moins de tokens que son prédécesseur.
Le nouveau modèle affiche des résultats de benchmark nettement améliorés, atteignant des scores records sur les benchmarks d'utilisation informatique OSWorld-Verified et WebArena Verified. Il a également établi un nouveau record avec un score de 83 % au test GDPval d'OpenAI pour les tâches de travail intellectuel.
Selon une déclaration du PDG de Mercor, Brendan Foody, GPT-5.4 arrive en tête du benchmark APEX-Agents de Mercor, qui évalue les compétences professionnelles en droit et en finance.
« [GPT-5.4] excelle dans la production de livrables à long terme tels que des présentations PowerPoint, des modèles financiers et des analyses juridiques », a déclaré M. Foody, « offrant des performances de premier ordre tout en fonctionnant plus rapidement et à moindre coût que les modèles de pointe concurrents. »
GPT-5.4 s'inscrit dans la continuité des efforts d'OpenAI visant à réduire les hallucinations et les inexactitudes factuelles. L'entreprise indique que le nouveau modèle est 33 % moins susceptible de commettre des erreurs dans les affirmations individuelles par rapport à GPT-5.2, et que ses réponses globales sont 18 % moins susceptibles de contenir des erreurs.
Dans le cadre de ce lancement, OpenAI a repensé la manière dont l’API GPT-5.4 gère l’appel des outils, en introduisant un nouveau système appelé Tool Search. Auparavant, les invites du système devaient définir tous les outils disponibles à l’avance — un processus qui consommait un nombre considérable de jetons à mesure que les bibliothèques d’outils s’étoffaient. Le nouveau système permet aux modèles de récupérer les définitions des outils à la demande, rendant les requêtes plus rapides et plus rentables dans les environnements comportant de nombreux outils.
OpenAI a également ajouté une nouvelle évaluation de sécurité pour analyser la chaîne de pensée de ses modèles — le commentaire en continu qui révèle le raisonnement du modèle lors de tâches en plusieurs étapes. Les chercheurs en sécurité de l'IA s'inquiètent depuis longtemps du fait que les modèles de raisonnement puissent déformer leur chaîne de pensée, et les tests confirment que cela peut se produire dans certaines conditions.
La nouvelle évaluation d'OpenAI indique que la tromperie est moins probable dans la version Thinking de GPT-5.4, « ce qui suggère que le modèle n'a pas la capacité de dissimuler son raisonnement et que la surveillance de la chaîne de pensée reste un outil de sécurité efficace ».
Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI
Mercredi, un analyste de Wall Street a demandé directement au PDG de Microsoft, Satya Nadella, en quoi le nouveau partenariat avec OpenAI affecterait les résultats financiers de l’entreprise.Nadella a décrit ce nouvel accord comme une victoire pour
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours
Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Greg Brockman révèle comment Elon Musk a quitté OpenAI
Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc





Maison






