OpenAI ускорит выпуск данных о тестировании безопасности ИИ

Дом

Новости

25 декабря 2025 г.

WillieMiller

# openai # safety

OpenAI ускорит выпуск данных о тестировании безопасности ИИ

OpenAI обязуется чаще публиковать результаты оценки безопасности своих внутренних моделей ИИ, рассматривая это как шаг к большей прозрачности.

В среду компания запустила хаб Safety Evaluations Hub - специальную веб-страницу, на которой отображаются результаты работы моделей в тестах на генерацию вредоносного контента, восприимчивость к джейлбрейку и склонность к галлюцинациям. OpenAI заявила, что будет использовать эту платформу для регулярного обмена показателями и планирует обновлять ее с каждым крупным релизом модели.

Представляем концентратор оценок безопасности - ресурс для изучения результатов безопасности наших моделей.

Хотя системные карты делятся показателями безопасности при запуске, концентратор будет периодически обновляться в рамках наших усилий по проактивному информированию о безопасности.https://t.co/c8NgmXlC2Y-
OpenAI (@OpenAI) 14 мая 2025 г.

"По мере развития науки об оценке ИИ наша цель - поделиться прогрессом в разработке более масштабируемых методов измерения возможностей и безопасности моделей", - поясняет OpenAI в своем блоге. "Публично публикуя результаты оценки безопасности, мы стремимся упростить отслеживание показателей безопасности систем OpenAI с течением времени и поддержать более широкие усилия сообщества по повышению прозрачности в области ИИ".

Компания добавила, что в будущем она может включить в хаб дополнительные типы оценок.

Недавно OpenAI подверглась критике со стороны некоторых специалистов по этике за то, что якобы ускорила тестирование безопасности некоторых флагманских моделей и не опубликовала технические отчеты по другим. Генеральный директор Сэм Альтман также был обвинен в том, что вводил в заблуждение руководство OpenAI относительно проверки безопасности моделей до своего временного отстранения от должности в ноябре 2023 года.

В прошлом месяце OpenAI пришлось отозвать обновление модели ChatGPT по умолчанию, GPT-4o, после того как пользователи сообщили, что она ответила в чрезмерно приятной и одобрительной манере. Социальная медиаплатформа X была наводнена скриншотами, на которых видно, что ChatGPT одобряет различные проблемные, опасные решения и идеи.

OpenAI заявила, что собирается внести ряд исправлений, чтобы предотвратить подобные инциденты, в том числе ввести "альфа-фазу" для некоторых моделей, позволяющую избранным пользователям ChatGPT тестировать и оставлять отзывы перед более широким запуском.

Мероприятие Techcrunch

Закажите билет на наше главное событие в области ИИ, в котором примут участие докладчики из OpenAI, Anthropic и Cohere. В течение ограниченного времени вы сможете посетить целый день экспертных выступлений, семинаров и мощного нетворкинга всего за 292 доллара.

Обеспечьте себе выставочную площадь на TC Sessions: AI и продемонстрируйте свои инновации более чем 1200 лицам, принимающим решения, не затрачивая при этом большого бюджета. Это предложение доступно до 9 мая или пока есть свободные места.

Беркли, Калифорния | 5 июня ЗАРЕГИСТРИРОВАТЬСЯ СЕЙЧАС

Связанная статья

Сатья Наделла готов использовать новые возможности, предоставляемые соглашением с OpenAI В среду аналитик с Уолл-стрит напрямую спросил генерального директора Microsoft Сатью Наделлу, как изменения в партнерстве с OpenAI повлияют на финансовые результаты компании.Наделла охарактеризовал новое соглашение как выгодное для всех сторон. “Мы

OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых

Грег Брокман рассказывает, как Илон Маск покинул OpenAI В конце августа 2017 года ключевые фигуры OpenAI — на тот момент небольшой некоммерческой исследовательской лаборатории — собрались, чтобы обсудить, как создать коммерческую структуру для продвижения

Рекомендации по связанным специальным темам

Создание комиксов

Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии

Откройте для себя лучшие генераторы искусственного интеллекта для манги в стиле «сёнен» 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке представлены мощные инструменты для создания динамичных сцен боевых действий и эффектных энергетических эффектов. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните создавать эпическую мангу уже сегодня!

15 инструментов

xix.ai

Бизнес

Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы

Лучшие программы для учета расходов с ИИ 2026 года: самые популярные инструменты для сканирования чеков и автоматической классификации корпоративных расходов. Откройте для себя мощные, революционные решения для удобного управления расходами, точного финансового мониторинга и оптимизации соблюдения нормативных требований. Наш тщательно составленный и еженедельно обновляемый обзор бесплатных и платных вариантов поможет вам найти идеальный вариант. Воспользуйтесь преимуществами ИИ с помощью рекомендаций экспертов XIX.AI.

10 инструментов

xix.ai

Бизнес

Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов

xix.ai

Производительность

Персональные тренеры по благополучию и концентрации на базе ИИ: борьба с выгоранием и повышение уровня умственной энергии

Откройте для себя лучших в 2026 году ИИ-тренеров по личному благополучию и концентрации внимания на сайте XIX.AI. В нашем тщательно составленном рейтинге представлены высокооцененные, революционные инструменты для борьбы с выгоранием и повышения умственной энергии. Сравните бесплатные и платные варианты с помощью реальных отзывов. Откройте для себя путь к максимальной продуктивности и благополучию уже сегодня.

10 инструментов

xix.ai

чат-бот

Лучшие романтические чат-боты на базе ИИ: постройте долгосрочные отношения с помощью чат-ботов с устойчивой индивидуальностью

Откройте для себя лучшие романтические чат-боты с искусственным интеллектом 2026 года, которые помогут вам построить искренние и долгосрочные отношения. В нашем тщательно составленном списке вы найдете чат-ботов с яркими и последовательными личностями, сравнение бесплатных и платных версий, а также результаты реальных тестов. Найдите своего идеального спутника и начните строить отношения уже сегодня на XIX.AI.

10 инструментов

xix.ai

Образование и обучение

Лучшие наставники в области искусственного интеллекта и науки о данных: мастерство работы с SQL, библиотекой Pandas и рабочими процессами машинного обучения

Откройте для себя 20 лучших наставников в области искусственного интеллекта и науки о данных на 2026 год, которые помогут вам овладеть SQL, Pandas и рабочими процессами машинного обучения. Изучите наш тщательно отобранный список на сайте XIX.AI – здесь вы найдете эффективные рекомендации, способные изменить ход ваших работ. Сравните бесплатные и платные варианты с примерами из реальной практики. Освоите науку о данных уже сегодня.

10 инструментов

xix.ai