Openai Advocates для ориентированных на отраслевые тесты ИИ: вот почему это важно

Результаты тестирования производительности являются обычной характеристикой при выпуске новых моделей ИИ, демонстрируя их возможности в выполнении различных общих задач, таких как школьная математика (GSM8K) или рассуждения на уровне выпускника (GPQA). Однако эти тесты часто не учитывают специфические потребности различных отраслей.
Также: ChatGPT теперь будет помнить все, что вы ему говорите — как настоящий личный помощник
Программа пионеров OpenAI
Чтобы восполнить этот пробел, OpenAI представила программу OpenAI Pioneers Program, разработанную для совершенствования разработки моделей ИИ для целевых отраслей и практических приложений. Эта инициатива представляет собой двухстороннее усилие, в рамках которого компании сотрудничают с исследователями OpenAI для создания более адаптированных оценок и доработки моделей под конкретные домены.
мы запускаем программу пионеров openai — партнерство между openai и компаниями, создающими передовые продукты ИИ, чтобы (а) интенсивно донастраивать модели, превосходящие в выполнении высокозначимых задач в специфических доменах, и (б) создавать лучшие оценки для реального мира, которые позволяют отраслям лучше… https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 апреля 2025
В недавнем посте в блоге OpenAI отметила, что такие сектора, как юриспруденция, финансы, страхование, здравоохранение и бухгалтерия, не имеют всеобъемлющего источника тестов. Для решения этой проблемы OpenAI планирует сотрудничать с несколькими компаниями в каждом секторе для разработки этих оценок. Такой подход направлен не только на совершенствование разработки моделей, но и на укрепление доверия между обществом и технологиями ИИ.
Также: ИИ не упирается в стену, он просто становится слишком умным для тестов, говорят в Anthropic
Исследования выявили отсутствие отраслевых тестов как значительное препятствие для ИИ в корпоративных условиях. Например, Сильвио Саварезе, руководитель Salesforce AI Research, обсудил концепцию корпоративного общего интеллекта (EGI) в посте в блоге. EGI фокусируется на передовых решениях ИИ, адаптированных под конкретные бизнес-домены. В беседе с ZDNET он подчеркнул важность разработки тестов, оценивающих функции, специфичные для домена, как ключевого шага к достижению EGI.
Совершенствование существующих моделей
Помимо создания новых оценок, OpenAI будет работать с компаниями над доработкой существующих моделей для трех конкретных отраслевых сценариев использования с помощью метода, называемого усиленной донастройкой (RFT). OpenAI предоставит рекомендации по внедрению RFT, позволяя компаниям затем самостоятельно решать, как лучше всего развертывать эти модели, которые, по словам OpenAI, будут готовы к использованию в больших масштабах.
Также: Гонка моделей ИИ внезапно стала намного ближе, говорят ученые из Стэнфорда
Первоначальная группа, участвующая в этой программе, будет включать ограниченное число стартапов, сосредоточенных на сценариях использования с значительным реальным воздействием. Если ваша компания соответствует этим критериям, вы можете подать заявку, отправив основную информацию о компании через веб-страницу программы OpenAI Pioneers Program.
Получайте главные новости утра в вашем почтовом ящике каждый день с нашей рассылкой Tech Today.
Связанная статья
Topaz DeNoise AI: лучший инструмент для шумоподавления в 2025 году - полное руководство
В конкурентном мире цифровой фотографии четкость изображения по-прежнему имеет первостепенное значение. Фотографы всех уровней мастерства сталкиваются с цифровым шумом, который портит отличные снимки.
Master Emerald Kaizo Nuzlocke: Ultimate Survival & Strategy Guide
Emerald Kaizo - один из самых грозных хаков для Pokémon ROM, которые когда-либо были придуманы. Несмотря на то, что попытка запустить Nuzlocke в разы увеличивает сложность игры, победа остается достиж
Сопроводительные письма на основе искусственного интеллекта: Экспертное руководство по подаче документов в журнал
В сегодняшней конкурентной среде научных изданий составление эффективного сопроводительного письма может сыграть решающую роль в принятии вашей рукописи. Узнайте, как инструменты с искусственным интел
Комментарии (23)
WillLopez
12 сентября 2025 г., 1:30:33 GMT+03:00
산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐
0
RichardSmith
27 августа 2025 г., 18:01:28 GMT+03:00
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄
0
JustinHarris
11 августа 2025 г., 8:00:59 GMT+03:00
This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄
0
JosephScott
23 апреля 2025 г., 20:47:18 GMT+03:00
OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀
0
FrankJackson
23 апреля 2025 г., 0:27:27 GMT+03:00
業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅
0
BrianThomas
22 апреля 2025 г., 2:41:13 GMT+03:00
A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀
0
Результаты тестирования производительности являются обычной характеристикой при выпуске новых моделей ИИ, демонстрируя их возможности в выполнении различных общих задач, таких как школьная математика (GSM8K) или рассуждения на уровне выпускника (GPQA). Однако эти тесты часто не учитывают специфические потребности различных отраслей.
Также: ChatGPT теперь будет помнить все, что вы ему говорите — как настоящий личный помощник
Программа пионеров OpenAI
Чтобы восполнить этот пробел, OpenAI представила программу OpenAI Pioneers Program, разработанную для совершенствования разработки моделей ИИ для целевых отраслей и практических приложений. Эта инициатива представляет собой двухстороннее усилие, в рамках которого компании сотрудничают с исследователями OpenAI для создания более адаптированных оценок и доработки моделей под конкретные домены.
мы запускаем программу пионеров openai — партнерство между openai и компаниями, создающими передовые продукты ИИ, чтобы (а) интенсивно донастраивать модели, превосходящие в выполнении высокозначимых задач в специфических доменах, и (б) создавать лучшие оценки для реального мира, которые позволяют отраслям лучше… https://t.co/cCvkGmYqJd
— Brad Lightcap (@bradlightcap) 9 апреля 2025
В недавнем посте в блоге OpenAI отметила, что такие сектора, как юриспруденция, финансы, страхование, здравоохранение и бухгалтерия, не имеют всеобъемлющего источника тестов. Для решения этой проблемы OpenAI планирует сотрудничать с несколькими компаниями в каждом секторе для разработки этих оценок. Такой подход направлен не только на совершенствование разработки моделей, но и на укрепление доверия между обществом и технологиями ИИ.
Также: ИИ не упирается в стену, он просто становится слишком умным для тестов, говорят в Anthropic
Исследования выявили отсутствие отраслевых тестов как значительное препятствие для ИИ в корпоративных условиях. Например, Сильвио Саварезе, руководитель Salesforce AI Research, обсудил концепцию корпоративного общего интеллекта (EGI) в посте в блоге. EGI фокусируется на передовых решениях ИИ, адаптированных под конкретные бизнес-домены. В беседе с ZDNET он подчеркнул важность разработки тестов, оценивающих функции, специфичные для домена, как ключевого шага к достижению EGI.
Совершенствование существующих моделей
Помимо создания новых оценок, OpenAI будет работать с компаниями над доработкой существующих моделей для трех конкретных отраслевых сценариев использования с помощью метода, называемого усиленной донастройкой (RFT). OpenAI предоставит рекомендации по внедрению RFT, позволяя компаниям затем самостоятельно решать, как лучше всего развертывать эти модели, которые, по словам OpenAI, будут готовы к использованию в больших масштабах.
Также: Гонка моделей ИИ внезапно стала намного ближе, говорят ученые из Стэнфорда
Первоначальная группа, участвующая в этой программе, будет включать ограниченное число стартапов, сосредоточенных на сценариях использования с значительным реальным воздействием. Если ваша компания соответствует этим критериям, вы можете подать заявку, отправив основную информацию о компании через веб-страницу программы OpenAI Pioneers Program.
Получайте главные новости утра в вашем почтовом ящике каждый день с нашей рассылкой Tech Today.




산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐




This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄




This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄




OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀




業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅




A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀












