OpenAI ускорит выпуск данных о тестировании безопасности ИИ

OpenAI обязуется чаще публиковать результаты оценки безопасности своих внутренних моделей ИИ, рассматривая это как шаг к большей прозрачности.
В среду компания запустила хаб Safety Evaluations Hub - специальную веб-страницу, на которой отображаются результаты работы моделей в тестах на генерацию вредоносного контента, восприимчивость к джейлбрейку и склонность к галлюцинациям. OpenAI заявила, что будет использовать эту платформу для регулярного обмена показателями и планирует обновлять ее с каждым крупным релизом модели.
Представляем концентратор оценок безопасности - ресурс для изучения результатов безопасности наших моделей.
Хотя системные карты делятся показателями безопасности при запуске, концентратор будет периодически обновляться в рамках наших усилий по проактивному информированию о безопасности.https://t.co/c8NgmXlC2Y-
OpenAI (@OpenAI) 14 мая 2025 г.
"По мере развития науки об оценке ИИ наша цель - поделиться прогрессом в разработке более масштабируемых методов измерения возможностей и безопасности моделей", - поясняет OpenAI в своем блоге. "Публично публикуя результаты оценки безопасности, мы стремимся упростить отслеживание показателей безопасности систем OpenAI с течением времени и поддержать более широкие усилия сообщества по повышению прозрачности в области ИИ".
Компания добавила, что в будущем она может включить в хаб дополнительные типы оценок.
Недавно OpenAI подверглась критике со стороны некоторых специалистов по этике за то, что якобы ускорила тестирование безопасности некоторых флагманских моделей и не опубликовала технические отчеты по другим. Генеральный директор Сэм Альтман также был обвинен в том, что вводил в заблуждение руководство OpenAI относительно проверки безопасности моделей до своего временного отстранения от должности в ноябре 2023 года.
В прошлом месяце OpenAI пришлось отозвать обновление модели ChatGPT по умолчанию, GPT-4o, после того как пользователи сообщили, что она ответила в чрезмерно приятной и одобрительной манере. Социальная медиаплатформа X была наводнена скриншотами, на которых видно, что ChatGPT одобряет различные проблемные, опасные решения и идеи.
OpenAI заявила, что собирается внести ряд исправлений, чтобы предотвратить подобные инциденты, в том числе ввести "альфа-фазу" для некоторых моделей, позволяющую избранным пользователям ChatGPT тестировать и оставлять отзывы перед более широким запуском.
Мероприятие TechcrunchПрисоединяйтесь к нам на TechCrunch Sessions: ИИ
Закажите билет на наше главное событие в области ИИ, в котором примут участие докладчики из OpenAI, Anthropic и Cohere. В течение ограниченного времени вы сможете посетить целый день экспертных выступлений, семинаров и мощного нетворкинга всего за 292 доллара.
Участвуйте в выставке TechCrunch Sessions: AI
Обеспечьте себе выставочную площадь на TC Sessions: AI и продемонстрируйте свои инновации более чем 1200 лицам, принимающим решения, не затрачивая при этом большого бюджета. Это предложение доступно до 9 мая или пока есть свободные места.
Беркли, Калифорния | 5 июня ЗАРЕГИСТРИРОВАТЬСЯ СЕЙЧАС
Связанная статья
Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI
В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей
В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
Грег Брокман рассказывает, как Илон Маск покинул OpenAI
В конце августа 2017 года ключевые фигуры OpenAI — на тот момент небольшой некоммерческой исследовательской лаборатории — собрались, чтобы обсудить, как создать коммерческую структуру для продвижения
Рекомендации по связанным специальным темам
Комментарии (0)

OpenAI обязуется чаще публиковать результаты оценки безопасности своих внутренних моделей ИИ, рассматривая это как шаг к большей прозрачности.
В среду компания запустила хаб Safety Evaluations Hub - специальную веб-страницу, на которой отображаются результаты работы моделей в тестах на генерацию вредоносного контента, восприимчивость к джейлбрейку и склонность к галлюцинациям. OpenAI заявила, что будет использовать эту платформу для регулярного обмена показателями и планирует обновлять ее с каждым крупным релизом модели.
Представляем концентратор оценок безопасности - ресурс для изучения результатов безопасности наших моделей.
OpenAI (@OpenAI) 14 мая 2025 г.
Хотя системные карты делятся показателями безопасности при запуске, концентратор будет периодически обновляться в рамках наших усилий по проактивному информированию о безопасности.https://t.co/c8NgmXlC2Y-
"По мере развития науки об оценке ИИ наша цель - поделиться прогрессом в разработке более масштабируемых методов измерения возможностей и безопасности моделей", - поясняет OpenAI в своем блоге. "Публично публикуя результаты оценки безопасности, мы стремимся упростить отслеживание показателей безопасности систем OpenAI с течением времени и поддержать более широкие усилия сообщества по повышению прозрачности в области ИИ".
Компания добавила, что в будущем она может включить в хаб дополнительные типы оценок.
Недавно OpenAI подверглась критике со стороны некоторых специалистов по этике за то, что якобы ускорила тестирование безопасности некоторых флагманских моделей и не опубликовала технические отчеты по другим. Генеральный директор Сэм Альтман также был обвинен в том, что вводил в заблуждение руководство OpenAI относительно проверки безопасности моделей до своего временного отстранения от должности в ноябре 2023 года.
В прошлом месяце OpenAI пришлось отозвать обновление модели ChatGPT по умолчанию, GPT-4o, после того как пользователи сообщили, что она ответила в чрезмерно приятной и одобрительной манере. Социальная медиаплатформа X была наводнена скриншотами, на которых видно, что ChatGPT одобряет различные проблемные, опасные решения и идеи.
OpenAI заявила, что собирается внести ряд исправлений, чтобы предотвратить подобные инциденты, в том числе ввести "альфа-фазу" для некоторых моделей, позволяющую избранным пользователям ChatGPT тестировать и оставлять отзывы перед более широким запуском.
Мероприятие TechcrunchПрисоединяйтесь к нам на TechCrunch Sessions: ИИ
Закажите билет на наше главное событие в области ИИ, в котором примут участие докладчики из OpenAI, Anthropic и Cohere. В течение ограниченного времени вы сможете посетить целый день экспертных выступлений, семинаров и мощного нетворкинга всего за 292 доллара.
Участвуйте в выставке TechCrunch Sessions: AI
Обеспечьте себе выставочную площадь на TC Sessions: AI и продемонстрируйте свои инновации более чем 1200 лицам, принимающим решения, не затрачивая при этом большого бюджета. Это предложение доступно до 9 мая или пока есть свободные места.
Беркли, Калифорния | 5 июня ЗАРЕГИСТРИРОВАТЬСЯ СЕЙЧАС
Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI
В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей
В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
Грег Брокман рассказывает, как Илон Маск покинул OpenAI
В конце августа 2017 года ключевые фигуры OpenAI — на тот момент небольшой некоммерческой исследовательской лаборатории — собрались, чтобы обсудить, как создать коммерческую структуру для продвижения





Дом






