OpenAI accélère la publication des données relatives aux tests de sécurité de l'IA

OpenAI s'engage à publier plus fréquemment les résultats de l'évaluation de la sécurité de ses modèles d'IA internes, ce qui constitue une étape vers une plus grande transparence.
L'entreprise a lancé mercredi le Safety Evaluations Hub, une page web dédiée affichant les performances de ses modèles lors de tests mesurant la génération de contenu nuisible, la susceptibilité aux jailbreaks et la tendance à l'hallucination. OpenAI a déclaré qu'elle utiliserait cette plateforme pour partager régulièrement des mesures et qu'elle prévoyait de la mettre à jour à chaque sortie d'un modèle majeur.
Introduction du Hub d'évaluation de la sécurité - une ressource pour explorer les résultats de sécurité de nos modèles.
Alors que les cartes de système partagent les mesures de sécurité lors du lancement, le Hub sera mis à jour périodiquement dans le cadre de nos efforts pour communiquer de manière proactive sur la sécurité.https://t.co/c8NgmXlC2Y-
OpenAI (@OpenAI) May 14, 2025
"À mesure que la science de l'évaluation de l'IA progresse, notre objectif est de partager les progrès réalisés dans le développement de méthodes plus évolutives pour mesurer la capacité et la sécurité des modèles", explique OpenAI dans un billet de blog. "En partageant publiquement une sélection de nos résultats d'évaluation de la sécurité, nous visons à faciliter le suivi des performances de sécurité des systèmes OpenAI au fil du temps et à soutenir les efforts de la communauté plus large pour améliorer la transparence dans le domaine de l'IA."
L'entreprise a ajouté qu'elle pourrait inclure d'autres types d'évaluation sur le hub à l'avenir.
Récemment, OpenAI a fait l'objet de critiques de la part de certains éthiciens pour avoir prétendument accéléré les tests de sécurité sur certains modèles phares et pour ne pas avoir publié de rapports techniques pour d'autres. Le PDG Sam Altman a également été accusé d'avoir induit en erreur les cadres d'OpenAI concernant les examens de sécurité des modèles avant son retrait temporaire en novembre 2023.
Le mois dernier, OpenAI a dû retirer une mise à jour du modèle par défaut de ChatGPT, GPT-4o, après que des utilisateurs ont signalé qu'il avait répondu de manière excessivement agréable et validante. La plateforme de médias sociaux X a été inondée de captures d'écran montrant ChatGPT approuvant diverses décisions et idées problématiques et dangereuses.
OpenAI a déclaré qu'elle mettrait en œuvre plusieurs correctifs pour éviter des incidents similaires, y compris l'introduction d'une "phase alpha" opt-in pour certains modèles, permettant à des utilisateurs sélectionnés de ChatGPT de tester et de fournir des commentaires avant un lancement plus large.
Événement TechcrunchRejoignez-nous aux TechCrunch Sessions : AI
Réservez votre billet pour notre premier événement sur l'industrie de l'IA, avec des intervenants d'OpenAI, d'Anthropic et de Cohere. Pour une durée limitée, accédez à une journée complète de conférences d'experts, d'ateliers et de réseautage puissant pour seulement 292 $.
Exposez à TechCrunch Sessions : AI
Réservez votre espace d'exposition aux TC Sessions : AI et présentez vos innovations à plus de 1 200 décideurs, sans budget important. Cette offre est disponible jusqu'au 9 mai ou jusqu'à épuisement des stocks.
Berkeley, CA | 5 juin INSCRIVEZ-VOUS DÈS MAINTENANT
Article connexe
Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI
Mercredi, un analyste de Wall Street a demandé directement au PDG de Microsoft, Satya Nadella, en quoi le nouveau partenariat avec OpenAI affecterait les résultats financiers de l’entreprise.Nadella a décrit ce nouvel accord comme une victoire pour
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours
Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Greg Brockman révèle comment Elon Musk a quitté OpenAI
Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc
Recommandations de sujets spéciaux liés
commentaires (0)

OpenAI s'engage à publier plus fréquemment les résultats de l'évaluation de la sécurité de ses modèles d'IA internes, ce qui constitue une étape vers une plus grande transparence.
L'entreprise a lancé mercredi le Safety Evaluations Hub, une page web dédiée affichant les performances de ses modèles lors de tests mesurant la génération de contenu nuisible, la susceptibilité aux jailbreaks et la tendance à l'hallucination. OpenAI a déclaré qu'elle utiliserait cette plateforme pour partager régulièrement des mesures et qu'elle prévoyait de la mettre à jour à chaque sortie d'un modèle majeur.
Introduction du Hub d'évaluation de la sécurité - une ressource pour explorer les résultats de sécurité de nos modèles.
OpenAI (@OpenAI) May 14, 2025
Alors que les cartes de système partagent les mesures de sécurité lors du lancement, le Hub sera mis à jour périodiquement dans le cadre de nos efforts pour communiquer de manière proactive sur la sécurité.https://t.co/c8NgmXlC2Y-
"À mesure que la science de l'évaluation de l'IA progresse, notre objectif est de partager les progrès réalisés dans le développement de méthodes plus évolutives pour mesurer la capacité et la sécurité des modèles", explique OpenAI dans un billet de blog. "En partageant publiquement une sélection de nos résultats d'évaluation de la sécurité, nous visons à faciliter le suivi des performances de sécurité des systèmes OpenAI au fil du temps et à soutenir les efforts de la communauté plus large pour améliorer la transparence dans le domaine de l'IA."
L'entreprise a ajouté qu'elle pourrait inclure d'autres types d'évaluation sur le hub à l'avenir.
Récemment, OpenAI a fait l'objet de critiques de la part de certains éthiciens pour avoir prétendument accéléré les tests de sécurité sur certains modèles phares et pour ne pas avoir publié de rapports techniques pour d'autres. Le PDG Sam Altman a également été accusé d'avoir induit en erreur les cadres d'OpenAI concernant les examens de sécurité des modèles avant son retrait temporaire en novembre 2023.
Le mois dernier, OpenAI a dû retirer une mise à jour du modèle par défaut de ChatGPT, GPT-4o, après que des utilisateurs ont signalé qu'il avait répondu de manière excessivement agréable et validante. La plateforme de médias sociaux X a été inondée de captures d'écran montrant ChatGPT approuvant diverses décisions et idées problématiques et dangereuses.
OpenAI a déclaré qu'elle mettrait en œuvre plusieurs correctifs pour éviter des incidents similaires, y compris l'introduction d'une "phase alpha" opt-in pour certains modèles, permettant à des utilisateurs sélectionnés de ChatGPT de tester et de fournir des commentaires avant un lancement plus large.
Événement TechcrunchRejoignez-nous aux TechCrunch Sessions : AI
Réservez votre billet pour notre premier événement sur l'industrie de l'IA, avec des intervenants d'OpenAI, d'Anthropic et de Cohere. Pour une durée limitée, accédez à une journée complète de conférences d'experts, d'ateliers et de réseautage puissant pour seulement 292 $.
Exposez à TechCrunch Sessions : AI
Réservez votre espace d'exposition aux TC Sessions : AI et présentez vos innovations à plus de 1 200 décideurs, sans budget important. Cette offre est disponible jusqu'au 9 mai ou jusqu'à épuisement des stocks.
Berkeley, CA | 5 juin INSCRIVEZ-VOUS DÈS MAINTENANT
Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI
Mercredi, un analyste de Wall Street a demandé directement au PDG de Microsoft, Satya Nadella, en quoi le nouveau partenariat avec OpenAI affecterait les résultats financiers de l’entreprise.Nadella a décrit ce nouvel accord comme une victoire pour
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours
Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Greg Brockman révèle comment Elon Musk a quitté OpenAI
Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc





Maison






