option
Maison
Nouvelles
GPT-5 d'OpenAI rivalise avec les performances humaines dans diverses professions

GPT-5 d'OpenAI rivalise avec les performances humaines dans diverses professions

31 octobre 2025
78

Jeudi, OpenAI a dévoilé GDPval, un référentiel révolutionnaire évaluant comment ses modèles d'IA se comparent aux professionnels humains dans divers secteurs d'activité. Cette évaluation constitue une première étape vers la détermination de si les systèmes d'OpenAI peuvent surpasser les humains dans un travail à impact économique – un objectif central dans la quête de l'intelligence artificielle générale (IAG) par l'entreprise.

Selon OpenAI, tant GPT-5 que Claude Opus 4.1 d'Anthropic démontrent une qualité de production approchant celle des spécialistes de l'industrie.

Bien que ces résultats n'impliquent pas un remplacement imminent des emplois humains, ils représentent un suivi de progrès crucial. OpenAI reconnaît que GDPval n'évalue actuellement qu'une fraction des tâches professionnelles réelles, contredisant les prédictions de certains PDG concernant une perturbation massive de l'IA dans les années à venir.

GDPval évalue la performance dans neuf secteurs clés du PIB américain – incluant la santé, la finance, la manufacturing et le gouvernement – testant 44 professions allant du génie logiciel au journalisme.

Pour GDPval-v0, des professionnels ont comparé des rapports générés par l'IA au travail de leurs homologues humains. Une tâche exemple impliquait des banquiers d'investissement analysant les paysages concurrentiels de la livraison du dernier kilomètre contre les versions de l'IA. OpenAI a calculé le "taux de victoire" de chaque modèle par rapport aux productions humaines sur toutes les professions.

Le modèle amélioré GPT-5-high a égalé ou dépassé la production experte 40,6 % du temps, tandis que Claude Opus 4.1 a atteint un taux de parité de 49 % – OpenAI suggère que ce score plus élevé pourrait refléter la présentation visuelle supérieure de Claude plutôt qu'un avantage substantiel.

Connectez-vous avec 10 000+ innovateurs technologiques et de capital-risque à Disrupt 2025

Avec Netflix, Box, a16z, ElevenLabs, Wayve, Sequoia Capital et Elad Gil parmi 250+ leaders du secteur accueillant 200+ sessions axées sur la croissance. Célébrez le 20e anniversaire de TechCrunch tout en acquérant des insights concurrentiels auprès des penseurs les plus éminents de la technologie. Une inscription anticipée avant le 26 septembre permet d'économiser jusqu'à 668 $.

Connectez-vous avec 10 000+ innovateurs technologiques et de capital-risque à Disrupt 2025

Avec Netflix, Box, a16z, ElevenLabs, Wayve, Sequoia Capital et Elad Gil parmi 250+ leaders du secteur accueillant 200+ sessions axées sur la croissance. Célébrez le 20e anniversaire de TechCrunch tout en acquérant des insights concurrentiels auprès des penseurs les plus éminents de la technologie. Une inscription anticipée avant le 26 septembre permet d'économiser jusqu'à 668 $.

Crédits image : OpenAI

OpenAI reconnaît la portée étroite de GDPval-v0 – testant actuellement uniquement la génération de rapports de recherche – et prévoit des itérations futures évaluant des interactions professionnelles plus larges.

Le Dr. Aaron Chatterji, Économiste en chef, a déclaré à TechCrunch que ces résultats indiquent que les professionnels peuvent de plus en plus déléguer des tâches routinières à l'IA, les libérant ainsi pour un travail à plus forte valeur ajoutée.

Tejal Patwardhan, responsable des évaluations, note des progrès rapides : GPT-4o n'a obtenu que 13,7 % il y a quinze mois, tandis que GPT-5 triple presque cette performance – une trajectoire qui devrait se poursuivre.

Alors que des référentiels comme AIME 2025 et GPQA Diamond dominent l'évaluation de l'IA, de nombreux modèles approchent de la saturation sur ces tests académiques. GDPval représente un accent croissant sur des normes d'évaluation pratiques et pertinentes pour l'industrie – bien qu'OpenAI nécessite des tests plus complets pour démontrer de manière concluante une performance de niveau humain dans tous les domaines professionnels.

Article connexe
Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI Mercredi, un analyste de Wall Street a demandé directement au PDG de Microsoft, Satya Nadella, en quoi le nouveau partenariat avec OpenAI affecterait les résultats financiers de l’entreprise.Nadella a décrit ce nouvel accord comme une victoire pour
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Greg Brockman révèle comment Elon Musk a quitté OpenAI Greg Brockman révèle comment Elon Musk a quitté OpenAI Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc
Recommandations de sujets spéciaux liés
Santé et bien-être Assistants IA pour la grossesse : créez des programmes d'entraînement et de nutrition sûrs, adaptés à chaque trimestre
Assistants IA pour la grossesse : créez des programmes d'entraînement et de nutrition sûrs, adaptés à chaque trimestre

Découvrez les meilleurs assistants de grossesse basés sur l'IA pour 2026, qui vous proposent des programmes d'entraînement et des plans nutritionnels personnalisés et sans risque, trimestre par trimestre. Bénéficiez de recommandations triées sur le volet et très bien notées, accompagnées de comparaisons entre les options gratuites et payantes ainsi que d'avis concrets. Vivez une grossesse en pleine forme grâce au guide d'experts de XIX.AI. Découvrez-le dès maintenant.

10 outils
xix.ai
en écrivant Les meilleurs outils gratuits d'écriture IA indétectables : transformez des brouillons robotiques en textes naturels, dignes d'un humain
Les meilleurs outils gratuits d'écriture IA indétectables : transformez des brouillons robotiques en textes naturels, dignes d'un humain

Découvrez les meilleurs générateurs de texte IA gratuits et indétectables de 2026 sur XIX.AI. Notre sélection rigoureuse des meilleurs outils vous aide à transformer des brouillons robotiques en textes naturels, dignes d'un humain. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Prenez dès aujourd'hui une longueur d'avance en matière de rédaction IA.

10 outils
xix.ai
Édition d'images Generateurs d'art par intelligence artificielle pour storyboards de courts drames : personnages de fantasy et de romance urbaine
Generateurs d'art par intelligence artificielle pour storyboards de courts drames : personnages de fantasy et de romance urbaine

2026 : Découvrez les meilleurs générateurs d’art artificiel pour les storyboards de courts métrages. Notre liste sélectionnée présente des outils hautement réputés pour créer des personnages captivants dans les genres fantasy et romance urbaine. Comparez les options gratuites et payantes, consultez les résultats de tests réels et trouvez le partenaire créatif idéal pour vous. Recevez chaque semaine des classements mis à jour et des conseils d’experts de XIX.AI. Commencez dès aujourd’hui à visualiser votre histoire !

10 outils
xix.ai
en écrivant Meilleurs outils d’scriptage AI pour la radio et la production de podcasts : rédiger des publicités audio captivantes
Meilleurs outils d’scriptage AI pour la radio et la production de podcasts : rédiger des publicités audio captivantes

Découvrez les 20 meilleurs outils de scriptage AI pour la radio et la production de podcasts en 2026 sur XIX.AI. Notre liste, soigneusement sélectionnée et hautement réputée, propose des solutions puissantes et révolutionnaires pour créer rapidement des publicités audio captivantes. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mises à jour chaque semaine. Développez votre potentiel créatif dès aujourd’hui !

10 outils
xix.ai
Entreprise Le meilleur logiciel d'analyse de contrats basé sur l'IA : identifiez instantanément les failles juridiques et les risques de non-conformité
Le meilleur logiciel d'analyse de contrats basé sur l'IA : identifiez instantanément les failles juridiques et les risques de non-conformité

Découvrez les meilleurs logiciels d'analyse de contrats basés sur l'IA pour 2026 sur XIX.AI. Notre sélection triée sur le volet et très bien notée regroupe des outils performants qui détectent instantanément les failles juridiques et les risques de non-conformité. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Trouvez la solution qui changera la donne pour une analyse de contrats sécurisée et efficace. Découvrez dès maintenant le guide complet.

10 outils
xix.ai
Création d'animations Generateur d'animation AI pour Donghua : Créer des personnages de romans web et des avatars de bandes dessinées
Generateur d'animation AI pour Donghua : Créer des personnages de romans web et des avatars de bandes dessinées

Découvrez les meilleurs générateurs d’animés AI de 2026 pour la création de doublages en chinois. Notre liste, sélectionnée avec soin, propose des outils puissants pour créer des personnages incroyables pour des romans web et des avatars de comics. Comparez les options gratuites et payantes grâce à des tests réels. Trouvez le partenaire créatif idéal et donnez vie à vos histoires dès aujourd’hui sur XIX.AI.

10 outils
xix.ai
commentaires (0)
0/500
OR