Openai Advocates для ориентированных на отраслевые тесты ИИ: вот почему это важно

Результаты тестирования производительности являются обычной характеристикой при выпуске новых моделей ИИ, демонстрируя их возможности в выполнении различных общих задач, таких как школьная математика (GSM8K) или рассуждения на уровне выпускника (GPQA). Однако эти тесты часто не учитывают специфические потребности различных отраслей.
Также: ChatGPT теперь будет помнить все, что вы ему говорите — как настоящий личный помощник
Программа пионеров OpenAI
Чтобы восполнить этот пробел, OpenAI представила программу OpenAI Pioneers Program, разработанную для совершенствования разработки моделей ИИ для целевых отраслей и практических приложений. Эта инициатива представляет собой двухстороннее усилие, в рамках которого компании сотрудничают с исследователями OpenAI для создания более адаптированных оценок и доработки моделей под конкретные домены.
мы запускаем программу пионеров openai — партнерство между openai и компаниями, создающими передовые продукты ИИ, чтобы (а) интенсивно донастраивать модели, превосходящие в выполнении высокозначимых задач в специфических доменах, и (б) создавать лучшие оценки для реального мира, которые позволяют отраслям лучше… https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 апреля 2025
В недавнем посте в блоге OpenAI отметила, что такие сектора, как юриспруденция, финансы, страхование, здравоохранение и бухгалтерия, не имеют всеобъемлющего источника тестов. Для решения этой проблемы OpenAI планирует сотрудничать с несколькими компаниями в каждом секторе для разработки этих оценок. Такой подход направлен не только на совершенствование разработки моделей, но и на укрепление доверия между обществом и технологиями ИИ.
Также: ИИ не упирается в стену, он просто становится слишком умным для тестов, говорят в Anthropic
Исследования выявили отсутствие отраслевых тестов как значительное препятствие для ИИ в корпоративных условиях. Например, Сильвио Саварезе, руководитель Salesforce AI Research, обсудил концепцию корпоративного общего интеллекта (EGI) в посте в блоге. EGI фокусируется на передовых решениях ИИ, адаптированных под конкретные бизнес-домены. В беседе с ZDNET он подчеркнул важность разработки тестов, оценивающих функции, специфичные для домена, как ключевого шага к достижению EGI.
Совершенствование существующих моделей
Помимо создания новых оценок, OpenAI будет работать с компаниями над доработкой существующих моделей для трех конкретных отраслевых сценариев использования с помощью метода, называемого усиленной донастройкой (RFT). OpenAI предоставит рекомендации по внедрению RFT, позволяя компаниям затем самостоятельно решать, как лучше всего развертывать эти модели, которые, по словам OpenAI, будут готовы к использованию в больших масштабах.
Также: Гонка моделей ИИ внезапно стала намного ближе, говорят ученые из Стэнфорда
Первоначальная группа, участвующая в этой программе, будет включать ограниченное число стартапов, сосредоточенных на сценариях использования с значительным реальным воздействием. Если ваша компания соответствует этим критериям, вы можете подать заявку, отправив основную информацию о компании через веб-страницу программы OpenAI Pioneers Program.
Получайте главные новости утра в вашем почтовом ящике каждый день с нашей рассылкой Tech Today.
Связанная статья
Новый Roewe i6 поступил в продажу по цене 659 000 юаней; в его основе лежат процессор Snapdragon 8155 и большая модель Doubao
Сегодня компания SAIC Roewe представила новый Roewe i6 — компактный седан, полностью воплотивший в себе стилистику модели Roewe D7. Характерная большая вертикальная решетка радиатора и горизонтальная
Как защитить имущество, здания и собственное здоровье?
В этом непредсказуемом мире защита стала стратегической необходимостью, а не просто одним из возможных вариантов. Будь то обеспечение финансовой безопасности, укрепление зданий или забота о собственно
Браузер Comet на базе искусственного интеллекта вышел на рынок с полной поддержкой многозадачности на iPad
Браузер Comet от Perplexity, основанный на искусственном интеллекте, официально выпустил версию для iPad, которая теперь полностью совместима с iPadOS. Обновление включает в себя многооконный режим пр
Рекомендации по связанным специальным темам
Комментарии (23)
산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄
OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

Результаты тестирования производительности являются обычной характеристикой при выпуске новых моделей ИИ, демонстрируя их возможности в выполнении различных общих задач, таких как школьная математика (GSM8K) или рассуждения на уровне выпускника (GPQA). Однако эти тесты часто не учитывают специфические потребности различных отраслей.
Также: ChatGPT теперь будет помнить все, что вы ему говорите — как настоящий личный помощник
Программа пионеров OpenAI
Чтобы восполнить этот пробел, OpenAI представила программу OpenAI Pioneers Program, разработанную для совершенствования разработки моделей ИИ для целевых отраслей и практических приложений. Эта инициатива представляет собой двухстороннее усилие, в рамках которого компании сотрудничают с исследователями OpenAI для создания более адаптированных оценок и доработки моделей под конкретные домены.
мы запускаем программу пионеров openai — партнерство между openai и компаниями, создающими передовые продукты ИИ, чтобы (а) интенсивно донастраивать модели, превосходящие в выполнении высокозначимых задач в специфических доменах, и (б) создавать лучшие оценки для реального мира, которые позволяют отраслям лучше… https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 апреля 2025
В недавнем посте в блоге OpenAI отметила, что такие сектора, как юриспруденция, финансы, страхование, здравоохранение и бухгалтерия, не имеют всеобъемлющего источника тестов. Для решения этой проблемы OpenAI планирует сотрудничать с несколькими компаниями в каждом секторе для разработки этих оценок. Такой подход направлен не только на совершенствование разработки моделей, но и на укрепление доверия между обществом и технологиями ИИ.
Также: ИИ не упирается в стену, он просто становится слишком умным для тестов, говорят в Anthropic
Исследования выявили отсутствие отраслевых тестов как значительное препятствие для ИИ в корпоративных условиях. Например, Сильвио Саварезе, руководитель Salesforce AI Research, обсудил концепцию корпоративного общего интеллекта (EGI) в посте в блоге. EGI фокусируется на передовых решениях ИИ, адаптированных под конкретные бизнес-домены. В беседе с ZDNET он подчеркнул важность разработки тестов, оценивающих функции, специфичные для домена, как ключевого шага к достижению EGI.
Совершенствование существующих моделей
Помимо создания новых оценок, OpenAI будет работать с компаниями над доработкой существующих моделей для трех конкретных отраслевых сценариев использования с помощью метода, называемого усиленной донастройкой (RFT). OpenAI предоставит рекомендации по внедрению RFT, позволяя компаниям затем самостоятельно решать, как лучше всего развертывать эти модели, которые, по словам OpenAI, будут готовы к использованию в больших масштабах.
Также: Гонка моделей ИИ внезапно стала намного ближе, говорят ученые из Стэнфорда
Первоначальная группа, участвующая в этой программе, будет включать ограниченное число стартапов, сосредоточенных на сценариях использования с значительным реальным воздействием. Если ваша компания соответствует этим критериям, вы можете подать заявку, отправив основную информацию о компании через веб-страницу программы OpenAI Pioneers Program.
Получайте главные новости утра в вашем почтовом ящике каждый день с нашей рассылкой Tech Today.
Новый Roewe i6 поступил в продажу по цене 659 000 юаней; в его основе лежат процессор Snapdragon 8155 и большая модель Doubao
Сегодня компания SAIC Roewe представила новый Roewe i6 — компактный седан, полностью воплотивший в себе стилистику модели Roewe D7. Характерная большая вертикальная решетка радиатора и горизонтальная
Как защитить имущество, здания и собственное здоровье?
В этом непредсказуемом мире защита стала стратегической необходимостью, а не просто одним из возможных вариантов. Будь то обеспечение финансовой безопасности, укрепление зданий или забота о собственно
Браузер Comet на базе искусственного интеллекта вышел на рынок с полной поддержкой многозадачности на iPad
Браузер Comet от Perplexity, основанный на искусственном интеллекте, официально выпустил версию для iPad, которая теперь полностью совместима с iPadOS. Обновление включает в себя многооконный режим пр
산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄
OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀





Дом






