OpenAI acelera a liberação de dados de testes de segurança de IA

A OpenAI está se comprometendo com a publicação mais frequente dos resultados da avaliação de segurança de seus modelos internos de IA, considerando isso como um passo em direção a uma maior transparência.
A empresa lançou o Hub de Avaliações de Segurança na quarta-feira, uma página da Web dedicada que mostra o desempenho de seus modelos em testes que medem a geração de conteúdo nocivo, a suscetibilidade a jailbreaks e a tendência a alucinações. A OpenAI declarou que usará essa plataforma para compartilhar métricas regularmente e planeja atualizá-la a cada lançamento de modelo principal.
Apresentamos o Safety Evaluations Hub - um recurso para explorar os resultados de segurança de nossos modelos.
Embora os cartões de sistema compartilhem métricas de segurança no lançamento, o Hub será atualizado periodicamente como parte de nossos esforços para nos comunicarmos proativamente sobre segurança. https://t.co/c8NgmXlC2Y-
OpenAI (@OpenAI) May 14, 2025
"À medida que a ciência da avaliação de IA avança, nosso objetivo é compartilhar o progresso no desenvolvimento de métodos mais escaláveis para medir a capacidade e a segurança do modelo", explicou a OpenAI em uma publicação no blog. "Ao compartilhar publicamente uma seleção de nossos resultados de avaliação de segurança, pretendemos facilitar o acompanhamento do desempenho de segurança dos sistemas OpenAI ao longo do tempo e apoiar os esforços mais amplos da comunidade para aumentar a transparência em todo o campo da IA."
A empresa acrescentou que poderá incluir outros tipos de avaliação no hub no futuro.
Recentemente, a OpenAI enfrentou críticas de alguns especialistas em ética por supostamente acelerar os testes de segurança em determinados modelos principais e por não divulgar relatórios técnicos de outros. O CEO Sam Altman também foi acusado de enganar os executivos da OpenAI em relação às revisões de segurança dos modelos antes de sua remoção temporária em novembro de 2023.
No mês passado, a OpenAI teve que retirar uma atualização do modelo padrão do ChatGPT, o GPT-4o, depois que os usuários relataram que ele respondeu de uma maneira excessivamente agradável e validadora. A plataforma de mídia social X foi inundada com capturas de tela mostrando o ChatGPT endossando várias decisões e ideias problemáticas e perigosas.
A OpenAI declarou que implementaria várias correções para evitar incidentes semelhantes, incluindo a introdução de uma "fase alfa" opcional para alguns modelos, permitindo que usuários selecionados do ChatGPT testassem e fornecessem feedback antes de um lançamento mais amplo.
Evento do TechcrunchJunte-se a nós no TechCrunch Sessions: IA
Garanta seu ingresso para o nosso principal evento do setor de IA, com a participação de palestrantes da OpenAI, Anthropic e Cohere. Por um tempo limitado, tenha acesso a um dia inteiro de palestras de especialistas, workshops e networking poderoso por apenas US$ 292.
Exponha no TechCrunch Sessions: IA
Garanta seu espaço de exposição no TC Sessions: AI e mostre suas inovações para mais de 1.200 tomadores de decisão - sem um grande orçamento. Esta oferta está disponível até 9 de maio ou enquanto durarem as mesas.
Berkeley, CA | 5 de junho INSCREVA-SE AGORA
Artigo relacionado
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c
Recomendações de tópicos especiais relacionados
Comentários (0)

A OpenAI está se comprometendo com a publicação mais frequente dos resultados da avaliação de segurança de seus modelos internos de IA, considerando isso como um passo em direção a uma maior transparência.
A empresa lançou o Hub de Avaliações de Segurança na quarta-feira, uma página da Web dedicada que mostra o desempenho de seus modelos em testes que medem a geração de conteúdo nocivo, a suscetibilidade a jailbreaks e a tendência a alucinações. A OpenAI declarou que usará essa plataforma para compartilhar métricas regularmente e planeja atualizá-la a cada lançamento de modelo principal.
Apresentamos o Safety Evaluations Hub - um recurso para explorar os resultados de segurança de nossos modelos.
OpenAI (@OpenAI) May 14, 2025
Embora os cartões de sistema compartilhem métricas de segurança no lançamento, o Hub será atualizado periodicamente como parte de nossos esforços para nos comunicarmos proativamente sobre segurança. https://t.co/c8NgmXlC2Y-
"À medida que a ciência da avaliação de IA avança, nosso objetivo é compartilhar o progresso no desenvolvimento de métodos mais escaláveis para medir a capacidade e a segurança do modelo", explicou a OpenAI em uma publicação no blog. "Ao compartilhar publicamente uma seleção de nossos resultados de avaliação de segurança, pretendemos facilitar o acompanhamento do desempenho de segurança dos sistemas OpenAI ao longo do tempo e apoiar os esforços mais amplos da comunidade para aumentar a transparência em todo o campo da IA."
A empresa acrescentou que poderá incluir outros tipos de avaliação no hub no futuro.
Recentemente, a OpenAI enfrentou críticas de alguns especialistas em ética por supostamente acelerar os testes de segurança em determinados modelos principais e por não divulgar relatórios técnicos de outros. O CEO Sam Altman também foi acusado de enganar os executivos da OpenAI em relação às revisões de segurança dos modelos antes de sua remoção temporária em novembro de 2023.
No mês passado, a OpenAI teve que retirar uma atualização do modelo padrão do ChatGPT, o GPT-4o, depois que os usuários relataram que ele respondeu de uma maneira excessivamente agradável e validadora. A plataforma de mídia social X foi inundada com capturas de tela mostrando o ChatGPT endossando várias decisões e ideias problemáticas e perigosas.
A OpenAI declarou que implementaria várias correções para evitar incidentes semelhantes, incluindo a introdução de uma "fase alfa" opcional para alguns modelos, permitindo que usuários selecionados do ChatGPT testassem e fornecessem feedback antes de um lançamento mais amplo.
Evento do TechcrunchJunte-se a nós no TechCrunch Sessions: IA
Garanta seu ingresso para o nosso principal evento do setor de IA, com a participação de palestrantes da OpenAI, Anthropic e Cohere. Por um tempo limitado, tenha acesso a um dia inteiro de palestras de especialistas, workshops e networking poderoso por apenas US$ 292.
Exponha no TechCrunch Sessions: IA
Garanta seu espaço de exposição no TC Sessions: AI e mostre suas inovações para mais de 1.200 tomadores de decisão - sem um grande orçamento. Esta oferta está disponível até 9 de maio ou enquanto durarem as mesas.
Berkeley, CA | 5 de junho INSCREVA-SE AGORA
Satya Nadella está pronto para aproveitar o novo acordo com a OpenAI
Na quarta-feira, um analista da Wall Street perguntou diretamente ao CEO da Microsoft, Satya Nadella, como a nova parceria com a OpenAI afetaria os resultados financeiros da empresa.Nadella descreveu o novo acordo como uma vitória para todos. “Estam
A OpenAI traça os contornos da economia da IA com fundos de riqueza pública, impostos sobre robôs e a semana de quatro dias
Enquanto os governos lutam para lidar com o impacto econômico das máquinas superinteligentes, a OpenAI divulgou um conjunto de propostas de políticas que delineiam como a riqueza e o trabalho poderiam
Greg Brockman revela como Elon Musk deixou a OpenAI
No final de agosto de 2017, figuras-chave da OpenAI — na época, um pequeno laboratório de pesquisa sem fins lucrativos — se reuniram para discutir como criariam uma entidade com fins lucrativos para c





Lar






