OpenAI acelerará la publicación de datos sobre pruebas de seguridad de la IA

OpenAI se compromete a publicar con más frecuencia los resultados de las evaluaciones de seguridad de sus modelos internos de IA, lo que considera un paso hacia una mayor transparencia.
La empresa lanzó el miércoles el Safety Evaluations Hub, una página web dedicada a mostrar el rendimiento de sus modelos en pruebas que miden la generación de contenidos nocivos, la susceptibilidad a las fugas de la cárcel y la tendencia a alucinar. OpenAI declaró que utilizará esta plataforma para compartir métricas con regularidad y que planea actualizarla con cada lanzamiento importante de un modelo.
Presentando el Hub de Evaluaciones de Seguridad-un recurso para explorar los resultados de seguridad de nuestros modelos.
Mientras que las tarjetas del sistema comparten métricas de seguridad en el lanzamiento, el Hub se actualizará periódicamente como parte de nuestros esfuerzos para comunicar proactivamente sobre la seguridad.https://t.co/c8NgmXlC2Y-
OpenAI (@OpenAI) 14 de mayo de 2025
"A medida que avanza la ciencia de la evaluación de la IA, nuestro objetivo es compartir los avances en el desarrollo de métodos más escalables para medir la capacidad y la seguridad de los modelos", explicó OpenAI en una entrada de blog. "Al compartir públicamente una selección de nuestros resultados de evaluación de seguridad, nuestro objetivo es facilitar el seguimiento del rendimiento de seguridad de los sistemas OpenAI a lo largo del tiempo y apoyar los esfuerzos de la comunidad más amplia para mejorar la transparencia en todo el campo de la IA."
La empresa añadió que es posible que en el futuro incluya otros tipos de evaluación en el hub.
Recientemente, OpenAI se ha enfrentado a las críticas de algunos expertos en ética por acelerar supuestamente las pruebas de seguridad de algunos modelos emblemáticos y por no publicar los informes técnicos de otros. El CEO Sam Altman también ha sido acusado de engañar a los ejecutivos de OpenAI con respecto a las revisiones de seguridad de los modelos antes de su destitución temporal en noviembre de 2023.
El mes pasado, OpenAI tuvo que retractarse de una actualización del modelo predeterminado de ChatGPT, GPT-4o, después de que los usuarios denunciaran que respondía de forma excesivamente agradable y validadora. La plataforma de medios sociales X se vio inundada de capturas de pantalla que mostraban a ChatGPT avalando diversas decisiones e ideas problemáticas y peligrosas.
OpenAI declaró que aplicaría varias correcciones para evitar incidentes similares, incluida la introducción de una "fase alfa" opcional para algunos modelos, lo que permitiría a los usuarios seleccionados de ChatGPT probar y proporcionar comentarios antes de un lanzamiento más amplio.
Evento de TechcrunchÚnase a nosotros en las sesiones de TechCrunch: AI
Asegure su entrada para nuestro principal evento del sector de la IA, con ponentes de OpenAI, Anthropic y Cohere. Por tiempo limitado, acceda a un día completo de charlas de expertos, talleres y potentes redes de contactos por sólo 292 $.
Exponga en TechCrunch Sessions: AI
Asegúrese su espacio de exposición en TC Sessions: AI y muestre sus innovaciones a más de 1.200 responsables de la toma de decisiones, sin necesidad de un gran presupuesto. Esta oferta está disponible hasta el 9 de mayo o hasta agotar existencias.
Berkeley, CA | 5 de junio REGÍSTRESE AHORA
Artículo relacionado
Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI
El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días
Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf
Greg Brockman desvela cómo Elon Musk abandonó OpenAI
A finales de agosto de 2017, las figuras clave de OpenAI —por entonces un pequeño laboratorio de investigación sin ánimo de lucro— se reunieron para debatir cómo crearían una entidad con fines lucrati
Recomendaciones de temas especiales relacionados
comentario (0)
0/500

OpenAI se compromete a publicar con más frecuencia los resultados de las evaluaciones de seguridad de sus modelos internos de IA, lo que considera un paso hacia una mayor transparencia.
La empresa lanzó el miércoles el Safety Evaluations Hub, una página web dedicada a mostrar el rendimiento de sus modelos en pruebas que miden la generación de contenidos nocivos, la susceptibilidad a las fugas de la cárcel y la tendencia a alucinar. OpenAI declaró que utilizará esta plataforma para compartir métricas con regularidad y que planea actualizarla con cada lanzamiento importante de un modelo.
Presentando el Hub de Evaluaciones de Seguridad-un recurso para explorar los resultados de seguridad de nuestros modelos.
OpenAI (@OpenAI) 14 de mayo de 2025
Mientras que las tarjetas del sistema comparten métricas de seguridad en el lanzamiento, el Hub se actualizará periódicamente como parte de nuestros esfuerzos para comunicar proactivamente sobre la seguridad.https://t.co/c8NgmXlC2Y-
"A medida que avanza la ciencia de la evaluación de la IA, nuestro objetivo es compartir los avances en el desarrollo de métodos más escalables para medir la capacidad y la seguridad de los modelos", explicó OpenAI en una entrada de blog. "Al compartir públicamente una selección de nuestros resultados de evaluación de seguridad, nuestro objetivo es facilitar el seguimiento del rendimiento de seguridad de los sistemas OpenAI a lo largo del tiempo y apoyar los esfuerzos de la comunidad más amplia para mejorar la transparencia en todo el campo de la IA."
La empresa añadió que es posible que en el futuro incluya otros tipos de evaluación en el hub.
Recientemente, OpenAI se ha enfrentado a las críticas de algunos expertos en ética por acelerar supuestamente las pruebas de seguridad de algunos modelos emblemáticos y por no publicar los informes técnicos de otros. El CEO Sam Altman también ha sido acusado de engañar a los ejecutivos de OpenAI con respecto a las revisiones de seguridad de los modelos antes de su destitución temporal en noviembre de 2023.
El mes pasado, OpenAI tuvo que retractarse de una actualización del modelo predeterminado de ChatGPT, GPT-4o, después de que los usuarios denunciaran que respondía de forma excesivamente agradable y validadora. La plataforma de medios sociales X se vio inundada de capturas de pantalla que mostraban a ChatGPT avalando diversas decisiones e ideas problemáticas y peligrosas.
OpenAI declaró que aplicaría varias correcciones para evitar incidentes similares, incluida la introducción de una "fase alfa" opcional para algunos modelos, lo que permitiría a los usuarios seleccionados de ChatGPT probar y proporcionar comentarios antes de un lanzamiento más amplio.
Evento de TechcrunchÚnase a nosotros en las sesiones de TechCrunch: AI
Asegure su entrada para nuestro principal evento del sector de la IA, con ponentes de OpenAI, Anthropic y Cohere. Por tiempo limitado, acceda a un día completo de charlas de expertos, talleres y potentes redes de contactos por sólo 292 $.
Exponga en TechCrunch Sessions: AI
Asegúrese su espacio de exposición en TC Sessions: AI y muestre sus innovaciones a más de 1.200 responsables de la toma de decisiones, sin necesidad de un gran presupuesto. Esta oferta está disponible hasta el 9 de mayo o hasta agotar existencias.
Berkeley, CA | 5 de junio REGÍSTRESE AHORA
Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI
El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días
Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf
Greg Brockman desvela cómo Elon Musk abandonó OpenAI
A finales de agosto de 2017, las figuras clave de OpenAI —por entonces un pequeño laboratorio de investigación sin ánimo de lucro— se reunieron para debatir cómo crearían una entidad con fines lucrati





Hogar






