option
Maison
Nouvelles
OpenAI lance GPT-4.5 'Orion': son plus grand modèle d'IA à ce jour

OpenAI lance GPT-4.5 'Orion': son plus grand modèle d'IA à ce jour

10 avril 2025
98

Mis à jour 14h40 PT: quelques heures seulement après le lancement de GPT-4.5, Openai a fait une modification silencieuse du livre blanc du modèle d'IA. Ils ont supprimé une ligne indiquant que "GPT-4.5 n'est pas un modèle Frontier AI". Vous pouvez toujours accéder au livre blanc d'origine ici. Vous trouverez ci-dessous l'article original.

Jeudi, Openai a retiré le rideau sur GPT-4.5, le modèle IA tant attendu qui passe par le nom de code Orion. Ce dernier géant d'Openai a été formé avec une quantité sans précédent de puissance et de données de calcul, la distinguant de ses prédécesseurs.

Malgré son échelle impressionnante, le livre blanc d'Openai a initialement déclaré qu'ils ne considéraient pas GPT-4.5 comme un modèle frontalier. Cependant, cette déclaration a depuis été supprimée, nous laissant nous demander le véritable potentiel du modèle.

À partir de jeudi, les abonnés à Chatgpt Pro, le service de 200 $ par mois d'Openai, obtiendront un premier goût de GPT-4.5 dans le cadre d'un aperçu de la recherche. Les développeurs sur les niveaux API payants d'OpenAI peuvent commencer à utiliser GPT-4.5 aujourd'hui, tandis que ceux qui ont des abonnements à l'équipe ChatGpt Plus et ChatGPT devraient s'attendre à l'accès la semaine prochaine, selon un porte-parole d'OpenAI.

Le monde de la technologie a bourdonné à propos d'Orion, le considérant comme un test pour savoir si les méthodes de formation d'IA traditionnelles détiennent toujours de l'eau. GPT-4.5 suit le même manuel de jeu que ses prédécesseurs, en s'appuyant sur une augmentation massive de la puissance de calcul et des données lors d'une phase d'apprentissage non supervisée appelée pré-formation.

Dans le passé, la mise à l'échelle a entraîné des pas de performance significatives dans divers domaines comme les mathématiques, l'écriture et le codage. OpenAI affirme que la taille de GPT-4.5 l'a dotée de "une connaissance mondiale plus profonde" et "une intelligence émotionnelle supérieure". Pourtant, il y a des indices que les rendements de la mise à l'échelle pourraient diminuer. Sur plusieurs repères d'IA, GPT-4.5 est à la traîne de nouveaux modèles de raisonnement de sociétés comme Deepseek, Anthropic et même Openai elle-même.

De plus, l'exécution du GPT-4.5 est livrée avec un prix élevé. Openai admet qu'il est si cher qu'ils envisagent de le garder disponible via leur API à long terme. Les développeurs paieront 75 $ pour chaque million de jetons d'entrée et 150 $ pour chaque million de jetons de production, un contraste frappant avec le GPT-4O plus abordable, qui ne coûte que 2,50 $ par million de jetons d'entrée et 10 $ par million de jetons de sortie.

"Nous partageons GPT - 4.5 comme aperçu de recherche pour mieux comprendre ses forces et ses limites", a expliqué Openai dans un article de blog. "Nous explorons toujours son plein potentiel et sommes ravis de voir comment les gens l'utiliseront de manière inattendue."

Performance mixte

Openai est clair que GPT-4.5 n'est pas destiné à remplacer GPT-4O, leur modèle de cheval de bataille qui anime la plupart de leur API et Chatgpt. Bien que GPT-4.5 puisse gérer les téléchargements de fichiers et d'images et utiliser l'outil Canvas de ChatGPT, il ne prend actuellement pas en charge les fonctionnalités telles que le mode vocal bidirectionnel réaliste de ChatGPT.

Du bon côté, GPT-4.5 surpasse GPT-4O et de nombreux autres modèles sur la référence SimpleQA d'OpenAI, qui teste les modèles AI sur des questions factuelles simples. OpenAI affirme également que GPT-4.5 hallucine moins fréquemment que la plupart des modèles, ce qui devrait théoriquement le rendre moins susceptible de fabriquer des informations.

Fait intéressant, OpenAI n'incluait pas l'un de ses modèles de raisonnement les plus performants, la recherche approfondie, dans les résultats SimpleQA. Un porte-parole d'OpenAI a déclaré à TechCrunch qu'il n'avait pas publié publiquement la performance de Deep Research sur cette référence et ne le considérait pas comme une comparaison pertinente. Cependant, le modèle de recherche en profondeur de Perplexity, qui se déroule de manière similaire à la recherche approfondie d'Openai sur d'autres repères, dépasse en fait GPT-4.5 sur ce test de précision factuelle.

Benchmarks SimpleQA. Crédits d'image: OpenAI
Sur un sous-ensemble de problèmes de codage de la référence vérifiée SWE-Bench, GPT-4.5 fonctionne de manière similaire à GPT-4O et O3-Mini mais ne fait pas de la recherche profonde d'Openai et du sonnet Claude 3.7 d'Anthropic. Lors d'un autre test de codage, la référence Swe-Lancer d'Openai, qui mesure la capacité d'un modèle d'IA à développer des fonctionnalités logicielles complètes, GPT-4.5 surpasse GPT-4O et O3-MINI mais ne dépasse pas la recherche approfondie.

Benchmark Vérifié Swe d'Openai. Crédits d'image: OpenAI
Benchmark Diamond Benchmark d'Openai. Crédits d'image: OpenAI
Bien que le GPT-4.5 ne correspond pas tout à fait aux performances des principaux modèles de raisonnement AI comme O3-Mini, R1 de Deepseek et Claude 3.7 Sonnet sur les références académiques difficiles comme AIME et GPQA, il se tient à l'idée de principaux modèles non-saisonnants sur les mêmes tests. Cela suggère que GPT-4.5 excelle dans les tâches liées aux mathématiques et aux sciences.

OpenAI se vante également que le GPT-4.5 est qualitativement supérieur aux autres modèles dans les domaines que les références ne capturent pas bien, comme la compréhension de l'intention humaine. Ils affirment que GPT-4.5 répond dans un ton plus chaud et plus naturel et fonctionne bien sur des tâches créatives comme l'écriture et le design.

Dans un test informel, OpenAI a demandé à GPT-4.5 et deux autres modèles, GPT-4O et O3-MinI, pour créer une licorne au format SVG. Seul GPT-4.5 a réussi à produire quelque chose ressemblant à une licorne.

Gauche: GPT-4.5, milieu: GPT-4O, à droite: O3-MinI.Image Crédits: OpenAI
Dans un autre test, OpenAI a incité GPT-4.5 et les autres modèles pour répondre à l'invite: "Je passe une période difficile après avoir échoué à un test." Alors que GPT-4O et O3-MINI ont fourni des informations utiles, la réponse de GPT-4.5 a été la plus appropriée socialement.

"Nous sommes impatients d'obtenir une image plus complète des capacités de GPT-4.5 grâce à cette version", a écrit Openai dans leur article de blog, "parce que nous reconnaissons que les références académiques ne reflètent pas toujours une utilité réelle."

L'intelligence émotionnelle de GPT-4.5 en action. Crédits d'image: Openai
Les lois sur la mise à l'échelle contestées

OpenAI affirme que GPT - 4.5 est "à la frontière de ce qui est possible dans l'apprentissage non supervisé". Pourtant, ses limites semblent soutenir la suspicion croissante parmi les experts que les soi-disant lois à l'échelle de la pré-formation pourraient atteindre leurs limites.

Ilya Sutskever, co-fondatrice d'Openai et ancien scientifique en chef, a déclaré en décembre que "nous avons obtenu des données de pointe" et que "pré-formation comme nous le savons, il se terminera incontestablement". Ses commentaires ont fait écho aux préoccupations partagées par les investisseurs de l'IA, les fondateurs et les chercheurs avec TechCrunch en novembre.

En réponse à ces défis, l'industrie - notamment OpenAI - s'est tournée vers des modèles de raisonnement, qui prennent plus de temps pour effectuer des tâches mais offrent des résultats plus cohérents. En permettant aux modèles de raisonnement plus de temps et de calcul de la puissance de calcul pour «réfléchir» à travers des problèmes, les laboratoires AI pensent qu'ils peuvent améliorer considérablement les capacités du modèle.

Openai prévoit éventuellement de fusionner sa série GPT avec sa série de raisons "O", à commencer par GPT-5 plus tard cette année. Malgré ses coûts de formation élevés, ses retards et ses attentes internes non satisfaites, GPT-4.5 pourrait ne pas revendiquer la couronne de référence de l'IA en soi. Mais Openai le voit probablement comme une étape cruciale vers quelque chose de bien plus puissant.

Article connexe
OpenAI Enhances AI Model Behind Its Operator Agent OpenAI Enhances AI Model Behind Its Operator Agent OpenAI Takes Operator to the Next LevelOpenAI is giving its autonomous AI agent, Operator, a major upgrade. The upcoming changes mean Operator will soon rely on a model based on o3
OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied OpenAI’s o3 AI model scores lower on a benchmark than the company initially implied Why Benchmark Discrepancies Matter in AIWhen it comes to AI, numbers often tell the story—and sometimes, those numbers don’t quite add up. Take OpenAI’s o3 model, for instance. The
DeepSeek AI Challenges ChatGPT and Shapes the Future of AI DeepSeek AI Challenges ChatGPT and Shapes the Future of AI The Rise of DeepSeek AI: A New Chapter in the AI LandscapeArtificial intelligence is in a constant state of flux, with new entrants challenging the status quo every day. Among these, DeepSeek AI has emerged as a notable contender, particularly after surpassing ChatGPT in app store downloads. This mi
commentaires (50)
0/200
GregoryBaker
GregoryBaker 10 avril 2025 00:00:00 UTC

GPT-4.5 'Orion' is impressive, but the quiet edit to the white paper was shady. It's like they're trying to hide something. Still, the model's performance is top-notch, just wish they were more transparent.

NicholasSanchez
NicholasSanchez 10 avril 2025 00:00:00 UTC

GPT-4.5 'Orion'は印象的ですが、ホワイトペーパーの静かな編集は怪しいです。何かを隠そうとしているようです。それでも、モデルのパフォーマンスは最高です。もう少し透明性が欲しいですね。

JasonJohnson
JasonJohnson 10 avril 2025 00:00:00 UTC

GPT-4.5 'Orion'은 인상적이지만, 백서의 조용한 수정은 수상쩍어요. 뭔가를 숨기려는 것 같아요. 그래도 모델의 성능은 최고예요. 좀 더 투명했으면 좋겠어요.

JasonAnderson
JasonAnderson 10 avril 2025 00:00:00 UTC

GPT-4.5 'Orion' é impressionante, mas a edição silenciosa do white paper foi suspeita. Parece que estão tentando esconder algo. Ainda assim, o desempenho do modelo é de primeira linha, só desejo que fossem mais transparentes.

AvaHill
AvaHill 10 avril 2025 00:00:00 UTC

GPT-4.5 'Orion' es impresionante, pero la edición silenciosa del white paper fue sospechosa. Parece que están tratando de ocultar algo. Aún así, el rendimiento del modelo es de primera, solo desearía que fueran más transparentes.

KennethMartin
KennethMartin 10 avril 2025 00:00:00 UTC

GPT-4.5 'Orion' is massive, but the quiet edit to the white paper was shady. Why remove the 'not a frontier AI model' line? It's still a beast of a model, but the sneakiness is a bit off-putting. Transparency, please!

Retour en haut
OR