вариант
Дом
Новости
OpenAI представляет две продвинутые модели ИИ с открытым весом

OpenAI представляет две продвинутые модели ИИ с открытым весом

28 августа 2025 г.
0

OpenAI во вторник объявила о выпуске двух моделей ИИ с открытым весом, обладающих возможностями, сравнимыми с серией o. Обе модели доступны для бесплатной загрузки на Hugging Face, причем OpenAI называет их "лидирующими" по множеству тестов для открытых моделей.

Модели представлены в двух вариантах: мощная gpt-oss-120b, работающая на одном GPU Nvidia, и легкая gpt-oss-20b, предназначенная для работы на стандартном ноутбуке с 16 ГБ памяти.

Этот запуск стал первым открытым языковым моделью OpenAI со времен GPT-2, представленной более пяти лет назад.

Во время брифинга OpenAI отметила, что ее открытые модели могут обрабатывать сложные запросы, подключаясь к более продвинутым облачным системам ИИ, как ранее сообщал TechCrunch. Это позволяет разработчикам подключать открытую модель к проприетарным моделям OpenAI для таких задач, как обработка изображений, при необходимости.

Хотя OpenAI изначально поддерживала модели ИИ с открытым исходным кодом, она в основном перешла на проприетарную модель разработки, создав процветающий бизнес, предоставляя доступ к API для предприятий и разработчиков.

В январе генеральный директор Сэм Альтман признал, что OpenAI, возможно, ошиблась, не уделяя приоритет технологиям с открытым исходным кодом. Теперь компания сталкивается с жесткой конкуренцией со стороны китайских лабораторий ИИ, таких как DeepSeek, Alibaba’s Qwen и Moonshot AI, которые завоевали популярность благодаря своим высокопроизводительным открытым моделям. (Модели Llama от Meta, некогда лидеры в области открытых ИИ, в прошлом году отстали.)

В июле администрация Трампа призвала американских разработчиков ИИ больше открывать технологии для продвижения ИИ, соответствующего американским ценностям, по всему миру.

Лидеры технологий и венчурного капитала на Disrupt 2025

Netflix, ElevenLabs, Wayve и Sequoia Capital — среди известных имен в программе Disrupt 2025, делящихся идеями для успеха стартапов и инноваций. Не пропустите 20-летие TechCrunch Disrupt, чтобы узнать мнение ведущих голосов технологий — берите билет сейчас и сэкономьте до $675 до повышения цен 7 августа.

Лидеры технологий и венчурного капитала на Disrupt 2025

Netflix, ElevenLabs, Wayve и Sequoia Capital — среди известных имен в программе Disrupt 2025, делящихся идеями для успеха стартапов и инноваций. Не пропустите 20-летие TechCrunch Disrupt, чтобы узнать мнение ведущих голосов технологий — берите билет сейчас и сэкономьте до $675 до повышения цен.

Сан-Франциско | 27-29 октября 2025 ЗАРЕГИСТРИРУЙТЕСЬ СЕЙЧАС

С gpt-oss OpenAI стремится завоевать разработчиков и поддержать инициативу администрации Трампа, поскольку обе стороны отметили рост китайских лабораторий ИИ в области открытого исходного кода.

«С момента основания в 2015 году миссия OpenAI заключалась в продвижении AGI на благо всего человечества», — заявил генеральный директор Сэм Альтман в заявлении для TechCrunch. «Мы рады видеть, как мир строит на открытой платформе ИИ, основанной на демократических ценностях США, свободно доступной и широко полезной».

Генеральный директор OpenAI Сэм Альтман
(Фото: Томохиро Осуми / Getty Images) Кредит изображения: Томохиро Осуми / Getty Images

Обзор производительности моделей

OpenAI разработала свою открытую модель, чтобы лидировать среди систем ИИ с открытым весом, и компания утверждает, что достигла этой цели.

В соревновательных тестах по программированию на Codeforces (с использованием инструментов) gpt-oss-120b набрала 2622, а gpt-oss-20b — 2516, превзойдя R1 от DeepSeek, но уступив o3 и o4-mini.

Производительность открытой модели OpenAI на Codeforces (кредит: OpenAI).

На экзамене Humanity’s Last Exam, строгом краудсорсинговом тесте по множеству предметов (с инструментами), gpt-oss-120b и gpt-oss-20b набрали 19% и 17,3% соответственно, опередив ведущие открытые модели от DeepSeek и Qwen, но уступив o3.

Производительность открытой модели OpenAI на HLE (кредит: OpenAI).

Примечательно, что открытые модели OpenAI демонстрируют значительно более высокий уровень галлюцинаций, чем их последние модели рассуждений, o3 и o4-mini.

Галлюцинации стали более выраженными в последних моделях рассуждений ИИ OpenAI, и компания признает, что все еще исследует причину. В техническом документе OpenAI отметила, что «меньшие модели с меньшим объемом знаний о мире, как ожидается, будут галлюцинировать больше, чем крупные передовые модели».

На PersonQA, внутреннем тесте OpenAI для оценки точности моделей в отношении информации о людях, gpt-oss-120b и gpt-oss-20b галлюцинировали в 49% и 53% ответов соответственно — более чем в три раза выше, чем у модели o1 (16%), и выше, чем у o4-mini (36%).

Обучение новых моделей

OpenAI заявляет, что ее открытые модели были разработаны с использованием техник, аналогичных проприетарным моделям. Каждая использует подход смеси экспертов (MoE), активируя меньше параметров на запрос для большей эффективности. Для gpt-oss-120b с общим количеством 117 миллиардов параметров на токен используется только 5,1 миллиарда.

Открытые модели обучались с использованием высокопроизводительного обучения с подкреплением (RL), метода пост-обучения с кластерами GPU Nvidia для улучшения принятия решений ИИ в симулированных условиях. Это повторяет обучение серии o от OpenAI и включает процесс цепочки рассуждений, требующий дополнительного времени и ресурсов для обработки ответов.

Это обучение позволяет открытым моделям преуспевать в управлении ИИ-агентами, поддерживая такие инструменты, как веб-поиск или выполнение кода Python в процессе рассуждений. Однако они ограничены только текстовыми задачами, не могут обрабатывать или генерировать изображения или аудио, в отличие от других моделей OpenAI.

Модели gpt-oss-120b и gpt-oss-20b выпущены под лицензией Apache 2.0, что позволяет предприятиям монетизировать их без платы или разрешения от OpenAI.

В отличие от полностью открытых моделей от лабораторий, таких как AI2, OpenAI не раскроет данные обучения своих открытых моделей, что, вероятно, обусловлено продолжающимися судебными исками, утверждающими ненадлежащее использование защищенных авторским правом материалов в обучении ИИ.

OpenAI несколько раз откладывала выпуск своих открытых моделей для устранения проблем безопасности. Помимо стандартных протоколов безопасности, компания оценивала, могут ли злоумышленники настроить gpt-oss для вредоносных целей, таких как кибератаки или создание биологического или химического оружия.

Тестирование OpenAI и внешних оценщиков показало, что gpt-oss может слегка улучшить биологические возможности, но не достигает порога «высокой опасности» компании, даже после тонкой настройки.

Хотя модели OpenAI лидируют среди открытых моделей, разработчики ожидают выпуска R2 от DeepSeek и новой открытой модели от лаборатории суперразума Meta.

Связанная статья
OpenAI представляет две продвинутые модели ИИ с открытым весом OpenAI представляет две продвинутые модели ИИ с открытым весом OpenAI во вторник объявила о выпуске двух моделей ИИ с открытым весом, обладающих возможностями, сравнимыми с серией o. Обе модели доступны для бесплатной загрузки на Hugging Face, причем OpenAI назыв
ByteDance представляет модель ИИ Seed-Thinking-v1.5 для усиления способностей к рассуждению ByteDance представляет модель ИИ Seed-Thinking-v1.5 для усиления способностей к рассуждению Гонка за продвинутыми ИИ с функцией рассуждения началась с модели o1 от OpenAI в сентябре 2024 года, набрав обороты с запуском R1 от DeepSeek в январе 2025 года.Крупные разработчики ИИ соревнуются в с
Инвестиция Oracle в $40 млрд на чипы Nvidia для AI-датцентра в Техасе Инвестиция Oracle в $40 млрд на чипы Nvidia для AI-датцентра в Техасе Oracle планирует инвестировать около $40 млрд в чипы Nvidia для нового крупного дата-центра в Техасе, разработанного OpenAI, как сообщает Financial Times. Эта сделка, одна из крупнейших по закупке чип
Вернуться к вершине
OR