Maison
Openai défend des références AI spécifiques à l'industrie: voici pourquoi c'est important

Les résultats de performance des benchmarks sont une caractéristique courante lors de la sortie de nouveaux modèles d'IA, démontrant leurs capacités dans une gamme de tâches générales telles que les mathématiques de niveau scolaire (GSM8K) ou le raisonnement de niveau universitaire (GPQA). Cependant, ces benchmarks ne répondent souvent pas aux besoins spécifiques de diverses industries.
Aussi : ChatGPT se souviendra désormais de tout ce que vous lui dites - comme un véritable assistant personnel
Programme Pionniers d'OpenAI
Pour combler cet écart, OpenAI a lancé le Programme Pionniers d'OpenAI, conçu pour améliorer le développement des modèles d'IA pour des industries ciblées et des applications pratiques. Cette initiative est un effort à double objectif où les entreprises collaborent avec les chercheurs d'OpenAI pour créer des évaluations plus adaptées et affiner les modèles pour répondre à des domaines spécifiques.
nous lançons le programme pionniers d'openai -- un partenariat entre openai et des entreprises développant des produits d'IA avancés pour (a) affiner intensivement des modèles qui surpassent dans des tâches spécifiques à des domaines de haute valeur, et (b) construire de meilleures évaluations du monde réel qui permettent aux industries de mieux… https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 avril 2025
Dans un récent article de blog, OpenAI a souligné que des secteurs tels que le droit, la finance, l'assurance, la santé et la comptabilité manquent d'une source de benchmarks complète. Pour y remédier, OpenAI prévoit de collaborer avec plusieurs entreprises dans chaque secteur pour développer ces évaluations. Cette approche vise non seulement à améliorer le développement des modèles, mais aussi à renforcer la confiance entre le public et les technologies d'IA.
Aussi : L'IA ne heurte pas un mur, elle devient simplement trop intelligente pour les benchmarks, selon Anthropic
La recherche a identifié l'absence de benchmarks spécifiques à l'industrie comme un défi majeur pour l'IA dans les environnements d'entreprise. Par exemple, Silvio Savarese, qui dirige Salesforce AI Research, a discuté du concept d'Intelligence Générale d'Entreprise (EGI) dans un article de blog. L'EGI se concentre sur des solutions d'IA avancées adaptées à des domaines professionnels spécifiques. Dans une discussion avec ZDNET, il a souligné l'importance de développer des benchmarks qui évaluent les fonctions spécifiques à un domaine comme une étape clé vers la réalisation de l'EGI.
Affiner les modèles existants
En plus de créer de nouvelles évaluations, OpenAI collaborera avec des entreprises pour affiner les modèles existants pour trois cas d'utilisation spécifiques à l'industrie grâce à une méthode appelée affinement par renforcement (RFT). OpenAI fournira des conseils sur la mise en œuvre du RFT, permettant aux entreprises de décider ensuite comment déployer au mieux ces modèles, qui devraient être prêts pour une utilisation à grande échelle selon OpenAI.
Aussi : La course aux modèles d'IA est soudainement devenue beaucoup plus serrée, selon les chercheurs de Stanford
Le groupe initial participant à ce programme comprendra un nombre sélectionné de startups axées sur des cas d'utilisation ayant un impact significatif dans le monde réel. Si votre entreprise répond à ces critères, vous pouvez postuler en soumettant des informations de base sur l'entreprise via la page web du Programme Pionniers d'OpenAI.
Recevez les principales actualités du matin dans votre boîte de réception chaque jour avec notre newsletter Tech Today.
Article connexe
Les notes de réunion générées par l'IA de Talat sont stockées directement sur votre appareil, et non dans le cloud
Granola, l'application de prise de notes basée sur l'IA et évaluée à 250 millions de dollars, a conquis les fondateurs d'entreprises technologiques et les investisseurs en capital-risque. Mais un déve
La nouvelle Roewe i6 arrive sur le marché au prix de 659 000 yuans, équipée d'un processeur Snapdragon 8155 et du modèle Doubao Large
SAIC Roewe a lancé aujourd'hui la nouvelle Roewe i6, une berline compacte qui reprend intégralement le langage stylistique de la Roewe D7. Sa grande calandre verticale caractéristique et sa barre lumi
Comment protéger ses biens, ses bâtiments et sa santé ?
Dans un monde imprévisible, la protection est devenue une nécessité stratégique, et non plus une simple option. Qu'il s'agisse de préserver ses finances, de renforcer ses bâtiments ou de prendre soin
Recommandations de sujets spéciaux liés
commentaires (23)
산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄
OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

Les résultats de performance des benchmarks sont une caractéristique courante lors de la sortie de nouveaux modèles d'IA, démontrant leurs capacités dans une gamme de tâches générales telles que les mathématiques de niveau scolaire (GSM8K) ou le raisonnement de niveau universitaire (GPQA). Cependant, ces benchmarks ne répondent souvent pas aux besoins spécifiques de diverses industries.
Aussi : ChatGPT se souviendra désormais de tout ce que vous lui dites - comme un véritable assistant personnel
Programme Pionniers d'OpenAI
Pour combler cet écart, OpenAI a lancé le Programme Pionniers d'OpenAI, conçu pour améliorer le développement des modèles d'IA pour des industries ciblées et des applications pratiques. Cette initiative est un effort à double objectif où les entreprises collaborent avec les chercheurs d'OpenAI pour créer des évaluations plus adaptées et affiner les modèles pour répondre à des domaines spécifiques.
nous lançons le programme pionniers d'openai -- un partenariat entre openai et des entreprises développant des produits d'IA avancés pour (a) affiner intensivement des modèles qui surpassent dans des tâches spécifiques à des domaines de haute valeur, et (b) construire de meilleures évaluations du monde réel qui permettent aux industries de mieux… https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 avril 2025
Dans un récent article de blog, OpenAI a souligné que des secteurs tels que le droit, la finance, l'assurance, la santé et la comptabilité manquent d'une source de benchmarks complète. Pour y remédier, OpenAI prévoit de collaborer avec plusieurs entreprises dans chaque secteur pour développer ces évaluations. Cette approche vise non seulement à améliorer le développement des modèles, mais aussi à renforcer la confiance entre le public et les technologies d'IA.
Aussi : L'IA ne heurte pas un mur, elle devient simplement trop intelligente pour les benchmarks, selon Anthropic
La recherche a identifié l'absence de benchmarks spécifiques à l'industrie comme un défi majeur pour l'IA dans les environnements d'entreprise. Par exemple, Silvio Savarese, qui dirige Salesforce AI Research, a discuté du concept d'Intelligence Générale d'Entreprise (EGI) dans un article de blog. L'EGI se concentre sur des solutions d'IA avancées adaptées à des domaines professionnels spécifiques. Dans une discussion avec ZDNET, il a souligné l'importance de développer des benchmarks qui évaluent les fonctions spécifiques à un domaine comme une étape clé vers la réalisation de l'EGI.
Affiner les modèles existants
En plus de créer de nouvelles évaluations, OpenAI collaborera avec des entreprises pour affiner les modèles existants pour trois cas d'utilisation spécifiques à l'industrie grâce à une méthode appelée affinement par renforcement (RFT). OpenAI fournira des conseils sur la mise en œuvre du RFT, permettant aux entreprises de décider ensuite comment déployer au mieux ces modèles, qui devraient être prêts pour une utilisation à grande échelle selon OpenAI.
Aussi : La course aux modèles d'IA est soudainement devenue beaucoup plus serrée, selon les chercheurs de Stanford
Le groupe initial participant à ce programme comprendra un nombre sélectionné de startups axées sur des cas d'utilisation ayant un impact significatif dans le monde réel. Si votre entreprise répond à ces critères, vous pouvez postuler en soumettant des informations de base sur l'entreprise via la page web du Programme Pionniers d'OpenAI.
Recevez les principales actualités du matin dans votre boîte de réception chaque jour avec notre newsletter Tech Today.
Les notes de réunion générées par l'IA de Talat sont stockées directement sur votre appareil, et non dans le cloud
Granola, l'application de prise de notes basée sur l'IA et évaluée à 250 millions de dollars, a conquis les fondateurs d'entreprises technologiques et les investisseurs en capital-risque. Mais un déve
La nouvelle Roewe i6 arrive sur le marché au prix de 659 000 yuans, équipée d'un processeur Snapdragon 8155 et du modèle Doubao Large
SAIC Roewe a lancé aujourd'hui la nouvelle Roewe i6, une berline compacte qui reprend intégralement le langage stylistique de la Roewe D7. Sa grande calandre verticale caractéristique et sa barre lumi
Comment protéger ses biens, ses bâtiments et sa santé ?
Dans un monde imprévisible, la protection est devenue une nécessité stratégique, et non plus une simple option. Qu'il s'agisse de préserver ses finances, de renforcer ses bâtiments ou de prendre soin
산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄
OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀











