Maison
L'OpenAI se lance dans la course à la construction d'une IA universelle capable d'accomplir n'importe quelle tâche
Peu après que Hunter Lightman soit devenu chercheur à l'OpenAI en 2022, il a assisté au lancement explosif de ChatGPT, l'un des produits à la croissance la plus rapide de l'histoire de la technologie. Pendant ce temps, le travail plus discret de Lightman se concentrait sur l'entraînement des modèles d'OpenAI pour qu'ils s'attaquent aux concours de mathématiques de l'élite des lycées.
Aujourd'hui, son équipe - MathGen - joue un rôle central dans la quête de l'OpenAI pour construire des modèles de raisonnement IA de pointe. Ces systèmes constituent l'épine dorsale des "agents d'IA" capables d'effectuer des tâches informatiques semblables à celles des humains.
"Très tôt, nous avons cherché à améliorer le raisonnement mathématique, un domaine dans lequel les modèles avaient du mal à s'imposer", explique Lightman à TechCrunch à propos des origines de MathGen.
Malgré les progrès réalisés, les modèles d'OpenAI restent imparfaits. Même ses systèmes les plus récents hallucinent des faits et échouent dans des tâches complexes.
Pourtant, le raisonnement mathématique s'est considérablement amélioré. Un modèle a récemment remporté la médaille d'or aux Olympiades internationales de mathématiques, un concours destiné aux étudiants en mathématiques les plus brillants du monde. L'OpenAI pense que ces capacités de raisonnement s'étendront à d'autres domaines et qu'elles alimenteront les agents d'intelligence artificielle polyvalents qu'elle envisage depuis longtemps.
Si le succès de ChatGPT a été le fruit du hasard, le développement des agents d'OpenAI représente des années d'efforts délibérés. "Bientôt, vous demanderez simplement aux ordinateurs de gérer des tâches", a prédit le PDG Sam Altman lors de la conférence des développeurs 2023 d'OpenAI. Nous appelons ces agents des "agents", dont le potentiel est stupéfiant.
Titans de la technologie confirmés pour Disrupt 2025
Netflix, ElevenLabs, Wayve et Sequoia Capital sont les têtes d'affiche du 20e anniversaire de TechCrunch Disrupt. Obtenez des informations exploitables de la part des plus grands esprits de la technologie - réservez vos billets dès aujourd'hui et économisez jusqu'à 675 $ avant que les prix n'augmentent.
Titans de la technologie confirmés pour Disrupt 2025
Netflix, ElevenLabs, Wayve et Sequoia Capital sont les têtes d'affiche du 20e anniversaire de TechCrunch Disrupt. Obtenez des informations utiles de la part des plus grands esprits de la technologie - réservez vos billets dès aujourd'hui et économisez jusqu'à 675 $ avant que les prix n'augmentent.
San Francisco | 27-29 octobre 2025 | INSCRIVEZ-VOUS DÈS MAINTENANT

Sam Altman, PDG d'OpenAI, s'exprimant lors du DevDay 2023 (Photo : Justin Sullivan/Getty Images) Bien que la vision d'Altman n'ait pas encore fait ses preuves, OpenAI a stupéfié le monde de la technologie avec son modèle de raisonnement "o1" en 2024. En l'espace de quelques mois, ses 21 chercheurs sont devenus les talents les plus convoités de la Silicon Valley -eta en a débauché cinq en leur offrant des rémunérations à neuf chiffres.
Le renouveau de l'apprentissage par renforcement
Les percées d'OpenAI en matière d'agents sont liées à l'apprentissage par renforcement (RL), où les modèles d'IA apprennent par simulation d'essais et d'erreurs. Bien que l'apprentissage par renforcement remonte à AlphaGo en 2016, OpenAI a passé des années à l'adapter aux agents informatiques.
Les premiers modèles GPT excellaient dans les textes mais échouaient dans les mathématiques de base. Le projet "Strawberry" de 2023 a combiné le RL avec le calcul en temps réel - permettant aux modèles de vérifier les étapes avant de répondre - et a ouvert la voie au raisonnement "en chaîne de pensée".
"Soudain, les modèles pouvaient revenir en arrière et s'auto-corriger, ce qui donnait l'impression d'être humain", se souvient le chercheur El Kishky.
Élargir les capacités de raisonnement
OpenAI a identifié deux vecteurs de mise à l'échelle : le calcul post-entraînement et l'allocation du temps de réponse. "Nous ne construisons pas seulement pour aujourd'hui, nous construisons pour l'évolutivité", a fait remarquer M. Lightman.
Une équipe dédiée aux "agents" a vu le jour en 2023, jetant les bases de l'o1. Contrairement à ses rivaux limités par les demandes de produits, OpenAI a donné la priorité à la recherche sur l'AGI, ce qui constitue un avantage stratégique.
Définir le raisonnement de l'IA
Les chercheurs débattent de la question de savoir si l'IA "raisonne" vraiment. Certains mettent l'accent sur l'efficacité informatique, d'autres sur des résultats semblables à ceux de l'homme. Il existe des critiques, mais ce sont les capacités qui comptent le plus, un peu comme les avions qui volent différemment des oiseaux.
Le défi des tâches subjectives
Les agents actuels gèrent bien le codage mais ont du mal avec les nuances, comme les achats en ligne. "Il s'agit fondamentalement d'un défi lié aux données", a expliqué M. Lightman. Les nouvelles techniques permettent de s'entraîner à des tâches moins vérifiables.
La solution IMO d'OpenAI utilisait l'exploration multi-agents, aujourd'hui imitée par Google et xAI. Le chercheur Noam Brown estime que les progrès rapides se poursuivent : "Il n'y a pas de ralentissement en vue.
À l'approche de GPT-5, OpenAI vise à maintenir son avance sur Google, Anthropic et Meta. L'objectif ultime ? Un agent qui exécute intuitivement n'importe quelle tâche numérique, surpassant entièrement le ChatGPT d'aujourd'hui.
Article connexe
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours
Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Guillermo Rauch, PDG de Vercel, laisse entrevoir une introduction en bourse alors que les agents IA font grimper le chiffre d'affaires
Contrairement à de nombreuses start-ups fondées avant ChatGPT qui peinent aujourd’hui à trouver leurs marques à l’ère de l’IA, Vercel, une plateforme d’outils de développement et d’hébergement de site
Greg Brockman révèle comment Elon Musk a quitté OpenAI
Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc
Recommandations de sujets spéciaux liés
commentaires (0)
Peu après que Hunter Lightman soit devenu chercheur à l'OpenAI en 2022, il a assisté au lancement explosif de ChatGPT, l'un des produits à la croissance la plus rapide de l'histoire de la technologie. Pendant ce temps, le travail plus discret de Lightman se concentrait sur l'entraînement des modèles d'OpenAI pour qu'ils s'attaquent aux concours de mathématiques de l'élite des lycées.
Aujourd'hui, son équipe - MathGen - joue un rôle central dans la quête de l'OpenAI pour construire des modèles de raisonnement IA de pointe. Ces systèmes constituent l'épine dorsale des "agents d'IA" capables d'effectuer des tâches informatiques semblables à celles des humains.
"Très tôt, nous avons cherché à améliorer le raisonnement mathématique, un domaine dans lequel les modèles avaient du mal à s'imposer", explique Lightman à TechCrunch à propos des origines de MathGen.
Malgré les progrès réalisés, les modèles d'OpenAI restent imparfaits. Même ses systèmes les plus récents hallucinent des faits et échouent dans des tâches complexes.
Pourtant, le raisonnement mathématique s'est considérablement amélioré. Un modèle a récemment remporté la médaille d'or aux Olympiades internationales de mathématiques, un concours destiné aux étudiants en mathématiques les plus brillants du monde. L'OpenAI pense que ces capacités de raisonnement s'étendront à d'autres domaines et qu'elles alimenteront les agents d'intelligence artificielle polyvalents qu'elle envisage depuis longtemps.
Si le succès de ChatGPT a été le fruit du hasard, le développement des agents d'OpenAI représente des années d'efforts délibérés. "Bientôt, vous demanderez simplement aux ordinateurs de gérer des tâches", a prédit le PDG Sam Altman lors de la conférence des développeurs 2023 d'OpenAI. Nous appelons ces agents des "agents", dont le potentiel est stupéfiant.
Titans de la technologie confirmés pour Disrupt 2025
Netflix, ElevenLabs, Wayve et Sequoia Capital sont les têtes d'affiche du 20e anniversaire de TechCrunch Disrupt. Obtenez des informations exploitables de la part des plus grands esprits de la technologie - réservez vos billets dès aujourd'hui et économisez jusqu'à 675 $ avant que les prix n'augmentent.
Titans de la technologie confirmés pour Disrupt 2025
Netflix, ElevenLabs, Wayve et Sequoia Capital sont les têtes d'affiche du 20e anniversaire de TechCrunch Disrupt. Obtenez des informations utiles de la part des plus grands esprits de la technologie - réservez vos billets dès aujourd'hui et économisez jusqu'à 675 $ avant que les prix n'augmentent.
San Francisco | 27-29 octobre 2025 | INSCRIVEZ-VOUS DÈS MAINTENANT

Bien que la vision d'Altman n'ait pas encore fait ses preuves, OpenAI a stupéfié le monde de la technologie avec son modèle de raisonnement "o1" en 2024. En l'espace de quelques mois, ses 21 chercheurs sont devenus les talents les plus convoités de la Silicon Valley -eta en a débauché cinq en leur offrant des rémunérations à neuf chiffres.
Le renouveau de l'apprentissage par renforcement
Les percées d'OpenAI en matière d'agents sont liées à l'apprentissage par renforcement (RL), où les modèles d'IA apprennent par simulation d'essais et d'erreurs. Bien que l'apprentissage par renforcement remonte à AlphaGo en 2016, OpenAI a passé des années à l'adapter aux agents informatiques.
Les premiers modèles GPT excellaient dans les textes mais échouaient dans les mathématiques de base. Le projet "Strawberry" de 2023 a combiné le RL avec le calcul en temps réel - permettant aux modèles de vérifier les étapes avant de répondre - et a ouvert la voie au raisonnement "en chaîne de pensée".
"Soudain, les modèles pouvaient revenir en arrière et s'auto-corriger, ce qui donnait l'impression d'être humain", se souvient le chercheur El Kishky.
Élargir les capacités de raisonnement
OpenAI a identifié deux vecteurs de mise à l'échelle : le calcul post-entraînement et l'allocation du temps de réponse. "Nous ne construisons pas seulement pour aujourd'hui, nous construisons pour l'évolutivité", a fait remarquer M. Lightman.
Une équipe dédiée aux "agents" a vu le jour en 2023, jetant les bases de l'o1. Contrairement à ses rivaux limités par les demandes de produits, OpenAI a donné la priorité à la recherche sur l'AGI, ce qui constitue un avantage stratégique.
Définir le raisonnement de l'IA
Les chercheurs débattent de la question de savoir si l'IA "raisonne" vraiment. Certains mettent l'accent sur l'efficacité informatique, d'autres sur des résultats semblables à ceux de l'homme. Il existe des critiques, mais ce sont les capacités qui comptent le plus, un peu comme les avions qui volent différemment des oiseaux.
Le défi des tâches subjectives
Les agents actuels gèrent bien le codage mais ont du mal avec les nuances, comme les achats en ligne. "Il s'agit fondamentalement d'un défi lié aux données", a expliqué M. Lightman. Les nouvelles techniques permettent de s'entraîner à des tâches moins vérifiables.
La solution IMO d'OpenAI utilisait l'exploration multi-agents, aujourd'hui imitée par Google et xAI. Le chercheur Noam Brown estime que les progrès rapides se poursuivent : "Il n'y a pas de ralentissement en vue.
À l'approche de GPT-5, OpenAI vise à maintenir son avance sur Google, Anthropic et Meta. L'objectif ultime ? Un agent qui exécute intuitivement n'importe quelle tâche numérique, surpassant entièrement le ChatGPT d'aujourd'hui.
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours
Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Guillermo Rauch, PDG de Vercel, laisse entrevoir une introduction en bourse alors que les agents IA font grimper le chiffre d'affaires
Contrairement à de nombreuses start-ups fondées avant ChatGPT qui peinent aujourd’hui à trouver leurs marques à l’ère de l’IA, Vercel, une plateforme d’outils de développement et d’hébergement de site
Greg Brockman révèle comment Elon Musk a quitté OpenAI
Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc











