Le lancement de GPT-5 confronté à des défis alors qu'OpenAI surmonte les obstacles

Mise à jour vendredi 8 août 2025, 17h21 HE : Peu après la publication de cet article, le cofondateur et PDG d'OpenAI, Sam Altman, a confirmé que l'entreprise rétablirait l'accès à GPT-4o et d'autres modèles antérieurs pour certains utilisateurs, reconnaissant que le déploiement de GPT-5 s'était avéré « plus chaotique que nous ne l'espérions ».
Pour dire les choses avec modération, le lancement très attendu du nouveau modèle d'OpenAI, GPT‑5, a connu un début difficile.
Même en passant outre les erreurs dans les graphiques et les dysfonctionnements des démonstrations vocales lors de la présentation en direct d'hier (qui a introduit quatre modèles distincts ainsi qu'un mode « Réflexion » disponible pour trois d'entre eux), de multiples rapports d'utilisateurs depuis la sortie montrent que GPT‑5 a du mal avec des problèmes relativement simples que les modèles précédents d'OpenAI — et les systèmes concurrents d'autres laboratoires d'IA — résolvent correctement.
Par exemple, le scientifique des données Colin Fraser a partagé des captures d'écran de GPT‑5 traitant incorrectement une preuve mathématique — à savoir, si 8,888 répétition est égal à 9 (ce qui n'est pas le cas).
Wow, I was just playing around before but it actually is stupid pic.twitter.com/ao51nOH0Ui
— Colin Fraser (@colin_fraser) August 8, 2025
Il a également échoué sur une simple équation arithmétique, 5,9 = x + 5,11, un problème que de nombreux élèves du primaire pourraient résoudre.
This is concerning. https://t.co/PUbeCSgtRV
— Benjamin De Kraker (@BenjaminDEKR) August 8, 2025
Utiliser GPT‑5 pour évaluer les graphiques défectueux de la propre présentation d'OpenAI n'a pas non plus produit de réponses utiles ou précises.
Q. Prove using an LLM-as-a-judge still doesn't work
A. pic.twitter.com/KnCK5Xs9ja
— Kangwook Lee (@Kangwook_Lee) August 7, 2025
De plus, il a buté sur ce problème文字uel plus délicat (qui, il est vrai, même moi j'ai trouvé challenging au début— bien que l'IA Grok 4 d'Elon Musk y ait répondu correctement. Pour un indice, souvenez-vous que les dalles ne peuvent pas être coupées ; les 80 doivent rester intactes).
Careful not to cut yourself on the jagged frontier pic.twitter.com/buJGgJ6baI
— Greg Burnham (@GregHBurnham) August 8, 2025
Dans mes tests, l'ancien modèle GPT‑4o a géré au moins un de ces problèmes mathématiques de manière plus fiable. Malheureusement, OpenAI supprime progressivement ces modèles antérieurs — y compris le précédent modèle par défaut GPT-4o et le modèle de raisonnement avancé o3 — pour les utilisateurs de ChatGPT, bien qu'ils resteront accessibles via l'API pour les développeurs à court terme.
Les performances en codage sont inférieures aux benchmarks
Malgré les benchmarks internes d'OpenAI et certains tests tiers montrant GPT‑5 comme le modèle le plus performant pour le codage, l'utilisation réelle suggère que Claude Opus 4.1 récemment amélioré d'Anthropic gère souvent les tâches « one-shot » plus efficacement — livrant l'application ou la construction logicielle souhaitée par l'utilisateur comme demandé. Voyez cet exemple du développeur Justin Sun, posté sur X :
Opus 4.1's one-shot attempt at "create a 3d capybara petting zoo" – 8 minutes total
This was honestly pretty insane, not only are the capybaras way cuter and moving, there are individual pet affinity levels, a day/night switcher, feeding, and even a screenshot feature pic.twitter.com/FiKTO3FKK4
— justin (@justinsunyt) August 7, 2025
De plus, un rapport de la firme de sécurité SPLX a révélé que les mesures de sécurité internes d'OpenAI présentaient des lacunes significatives dans des domaines tels que l'alignement commercial et la sensibilité aux injections d'invites et aux attaques logiques obscurcies.
Bien qu'anecdotiques, les retours précoces des utilisateurs experts en IA suggèrent un accueil globalement mitigé.
L'influenceur IA et ancien employé de Google Bilawal Sidhu a mené un sondage sur X demandant à ses followers un « bilan d'impression ». Avec 172 votes jusqu'à présent, la réponse prédominante a été « Plutôt moyen ».
Alright, GPT-5 vibe check
— Bilawal Sidhu (@bilawalsidhu) August 7, 2025
Comme l'a noté le compte pseudonyme AI Leaks and News, « Le consensus écrasant sur GPT-5, tant sur X que sur le AMA Reddit, est extrêmement négatif. »
The overwhelming consensus on GPT-5 from both X and the Reddit AMA are overwhelmingly negative
Most users are disgruntled about the broken model picker and non-pro users not having access to legacy models
What are your initial thoughts on GPT-5?
— AI Leaks and News (@AILeaksAndNews) August 8, 2025
Tibor Blaho, ingénieur principal chez AIPRM et commentateur IA bien connu sur X, a compilé un résumé approfondi des problèmes de déploiement de ChatGPT‑5. Il a souligné que l'une des fonctionnalités phares — un « routeur » automatique qui sélectionne le mode réflexion ou non-réflexion en fonction de la complexité de la requête — est devenue une plainte principale, car le modèle bascule souvent par défaut en mode non-réflexion pour de nombreux utilisateurs.
A bit sad how the GPT-5 launch is going so far, especially after the long wait and high expectations
– The automatic switching between models (the router) seems partly broken/unreliable
– It's unclear exactly which model you're actually interacting with (standard or mini,…
— Tibor Blaho (@btibor91) August 8, 2025
Des concurrents prêts à en profiter
En conséquence, le sentiment autour de ChatGPT‑5 est loin d'être uniformément positif — ce qui pose un sérieux défi pour OpenAI alors que la concurrence s'intensifie de la part des géants américains comme Google et Anthropic, et d'une liste croissante de grands modèles de langage chinois gratuits, open-source et performants, offrant des capacités que de nombreux modèles américains n'ont pas.
Prenez l'équipe de recherche Alibaba Qwen, qui a aujourd'hui amélioré son modèle haute performance Qwen 3 pour prendre en charge un contexte d'1 million de tokens. Cela permet aux utilisateurs d'échanger près de quatre fois plus d'informations par interaction que ce que GPT‑5 n'offre actuellement.
Avec l'autre version majeure d'OpenAI cette semaine — une nouvelle série de modèles open-source gpt‑oss — recevant également des premiers retours mitigés, les perspectives sont incertaines pour l'entreprise dédiée à l'IA leader en nombre d'utilisateurs (ChatGPT compte désormais 700 millions d'utilisateurs actifs hebdomadaires).
Ce sentiment est partagé sur le marché de prédiction Polymarket, où les utilisateurs parient massivement que Google aura probablement le modèle d'IA leader d'ici fin août 2025.
D'autres utilisateurs experts, tels que Matt Shumer, cofondateur et PDG d'Otherside AI — qui avait un accès anticipé à GPT‑5 et a publié une critique positive — ont suggéré que les opinions pourraient changer alors que les gens optimisent leurs flux de travail pour le nouveau modèle :
A lot of folks who are having a bad experience are using GPT-5 in agent harnesses that aren't yet optimized for it.
For every new model release, there's a time lag between release + when companies that integrate the model have it truly working well.
Agent companies rush to…
— Matt Shumer (@mattshumer_) August 8, 2025
Bien qu'il soit encore tôt pour GPT‑5 — et que les opinions pourraient considérablement changer à mesure que plus de personnes le testeront sur diverses tâches — les premiers signes suggèrent que ce n'est pas le « coup de circuit » qu'ont représenté les lancements précédents comme GPT-4, GPT-4o ou o3. C'est un signal inquiétant pour une entreprise qui a récemment sécurisé un nouveau tour de financement mais reste non rentable en raison de dépenses de R&D élevées.
Article connexe
Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI
Mercredi, un analyste de Wall Street a demandé directement au PDG de Microsoft, Satya Nadella, en quoi le nouveau partenariat avec OpenAI affecterait les résultats financiers de l’entreprise.Nadella a décrit ce nouvel accord comme une victoire pour
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours
Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Greg Brockman révèle comment Elon Musk a quitté OpenAI
Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc
Recommandations de sujets spéciaux liés
commentaires (1)

Mise à jour vendredi 8 août 2025, 17h21 HE : Peu après la publication de cet article, le cofondateur et PDG d'OpenAI, Sam Altman, a confirmé que l'entreprise rétablirait l'accès à GPT-4o et d'autres modèles antérieurs pour certains utilisateurs, reconnaissant que le déploiement de GPT-5 s'était avéré « plus chaotique que nous ne l'espérions ».
Pour dire les choses avec modération, le lancement très attendu du nouveau modèle d'OpenAI, GPT‑5, a connu un début difficile.
Même en passant outre les erreurs dans les graphiques et les dysfonctionnements des démonstrations vocales lors de la présentation en direct d'hier (qui a introduit quatre modèles distincts ainsi qu'un mode « Réflexion » disponible pour trois d'entre eux), de multiples rapports d'utilisateurs depuis la sortie montrent que GPT‑5 a du mal avec des problèmes relativement simples que les modèles précédents d'OpenAI — et les systèmes concurrents d'autres laboratoires d'IA — résolvent correctement.
Par exemple, le scientifique des données Colin Fraser a partagé des captures d'écran de GPT‑5 traitant incorrectement une preuve mathématique — à savoir, si 8,888 répétition est égal à 9 (ce qui n'est pas le cas).
Wow, I was just playing around before but it actually is stupid pic.twitter.com/ao51nOH0Ui
— Colin Fraser (@colin_fraser) August 8, 2025
Il a également échoué sur une simple équation arithmétique, 5,9 = x + 5,11, un problème que de nombreux élèves du primaire pourraient résoudre.
This is concerning. https://t.co/PUbeCSgtRV
— Benjamin De Kraker (@BenjaminDEKR) August 8, 2025
Utiliser GPT‑5 pour évaluer les graphiques défectueux de la propre présentation d'OpenAI n'a pas non plus produit de réponses utiles ou précises.
Q. Prove using an LLM-as-a-judge still doesn't work
— Kangwook Lee (@Kangwook_Lee) August 7, 2025
A. pic.twitter.com/KnCK5Xs9ja
De plus, il a buté sur ce problème文字uel plus délicat (qui, il est vrai, même moi j'ai trouvé challenging au début— bien que l'IA Grok 4 d'Elon Musk y ait répondu correctement. Pour un indice, souvenez-vous que les dalles ne peuvent pas être coupées ; les 80 doivent rester intactes).
Careful not to cut yourself on the jagged frontier pic.twitter.com/buJGgJ6baI
— Greg Burnham (@GregHBurnham) August 8, 2025
Dans mes tests, l'ancien modèle GPT‑4o a géré au moins un de ces problèmes mathématiques de manière plus fiable. Malheureusement, OpenAI supprime progressivement ces modèles antérieurs — y compris le précédent modèle par défaut GPT-4o et le modèle de raisonnement avancé o3 — pour les utilisateurs de ChatGPT, bien qu'ils resteront accessibles via l'API pour les développeurs à court terme.
Les performances en codage sont inférieures aux benchmarks
Malgré les benchmarks internes d'OpenAI et certains tests tiers montrant GPT‑5 comme le modèle le plus performant pour le codage, l'utilisation réelle suggère que Claude Opus 4.1 récemment amélioré d'Anthropic gère souvent les tâches « one-shot » plus efficacement — livrant l'application ou la construction logicielle souhaitée par l'utilisateur comme demandé. Voyez cet exemple du développeur Justin Sun, posté sur X :
Opus 4.1's one-shot attempt at "create a 3d capybara petting zoo" – 8 minutes total
— justin (@justinsunyt) August 7, 2025
This was honestly pretty insane, not only are the capybaras way cuter and moving, there are individual pet affinity levels, a day/night switcher, feeding, and even a screenshot feature pic.twitter.com/FiKTO3FKK4
De plus, un rapport de la firme de sécurité SPLX a révélé que les mesures de sécurité internes d'OpenAI présentaient des lacunes significatives dans des domaines tels que l'alignement commercial et la sensibilité aux injections d'invites et aux attaques logiques obscurcies.
Bien qu'anecdotiques, les retours précoces des utilisateurs experts en IA suggèrent un accueil globalement mitigé.
L'influenceur IA et ancien employé de Google Bilawal Sidhu a mené un sondage sur X demandant à ses followers un « bilan d'impression ». Avec 172 votes jusqu'à présent, la réponse prédominante a été « Plutôt moyen ».
Alright, GPT-5 vibe check
— Bilawal Sidhu (@bilawalsidhu) August 7, 2025
Comme l'a noté le compte pseudonyme AI Leaks and News, « Le consensus écrasant sur GPT-5, tant sur X que sur le AMA Reddit, est extrêmement négatif. »
The overwhelming consensus on GPT-5 from both X and the Reddit AMA are overwhelmingly negative
— AI Leaks and News (@AILeaksAndNews) August 8, 2025
Most users are disgruntled about the broken model picker and non-pro users not having access to legacy models
What are your initial thoughts on GPT-5?
Tibor Blaho, ingénieur principal chez AIPRM et commentateur IA bien connu sur X, a compilé un résumé approfondi des problèmes de déploiement de ChatGPT‑5. Il a souligné que l'une des fonctionnalités phares — un « routeur » automatique qui sélectionne le mode réflexion ou non-réflexion en fonction de la complexité de la requête — est devenue une plainte principale, car le modèle bascule souvent par défaut en mode non-réflexion pour de nombreux utilisateurs.
A bit sad how the GPT-5 launch is going so far, especially after the long wait and high expectations
— Tibor Blaho (@btibor91) August 8, 2025
– The automatic switching between models (the router) seems partly broken/unreliable
– It's unclear exactly which model you're actually interacting with (standard or mini,…
Des concurrents prêts à en profiter
En conséquence, le sentiment autour de ChatGPT‑5 est loin d'être uniformément positif — ce qui pose un sérieux défi pour OpenAI alors que la concurrence s'intensifie de la part des géants américains comme Google et Anthropic, et d'une liste croissante de grands modèles de langage chinois gratuits, open-source et performants, offrant des capacités que de nombreux modèles américains n'ont pas.
Prenez l'équipe de recherche Alibaba Qwen, qui a aujourd'hui amélioré son modèle haute performance Qwen 3 pour prendre en charge un contexte d'1 million de tokens. Cela permet aux utilisateurs d'échanger près de quatre fois plus d'informations par interaction que ce que GPT‑5 n'offre actuellement.
Avec l'autre version majeure d'OpenAI cette semaine — une nouvelle série de modèles open-source gpt‑oss — recevant également des premiers retours mitigés, les perspectives sont incertaines pour l'entreprise dédiée à l'IA leader en nombre d'utilisateurs (ChatGPT compte désormais 700 millions d'utilisateurs actifs hebdomadaires).
Ce sentiment est partagé sur le marché de prédiction Polymarket, où les utilisateurs parient massivement que Google aura probablement le modèle d'IA leader d'ici fin août 2025.
D'autres utilisateurs experts, tels que Matt Shumer, cofondateur et PDG d'Otherside AI — qui avait un accès anticipé à GPT‑5 et a publié une critique positive — ont suggéré que les opinions pourraient changer alors que les gens optimisent leurs flux de travail pour le nouveau modèle :
A lot of folks who are having a bad experience are using GPT-5 in agent harnesses that aren't yet optimized for it.
— Matt Shumer (@mattshumer_) August 8, 2025
For every new model release, there's a time lag between release + when companies that integrate the model have it truly working well.
Agent companies rush to…
Bien qu'il soit encore tôt pour GPT‑5 — et que les opinions pourraient considérablement changer à mesure que plus de personnes le testeront sur diverses tâches — les premiers signes suggèrent que ce n'est pas le « coup de circuit » qu'ont représenté les lancements précédents comme GPT-4, GPT-4o ou o3. C'est un signal inquiétant pour une entreprise qui a récemment sécurisé un nouveau tour de financement mais reste non rentable en raison de dépenses de R&D élevées.
Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI
Mercredi, un analyste de Wall Street a demandé directement au PDG de Microsoft, Satya Nadella, en quoi le nouveau partenariat avec OpenAI affecterait les résultats financiers de l’entreprise.Nadella a décrit ce nouvel accord comme une victoire pour
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours
Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Greg Brockman révèle comment Elon Musk a quitté OpenAI
Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc





Maison






