вариант
Дом
Новости
Openai Advocates для ориентированных на отраслевые тесты ИИ: вот почему это важно

Openai Advocates для ориентированных на отраслевые тесты ИИ: вот почему это важно

15 апреля 2025 г.
137

Openai Advocates для ориентированных на отраслевые тесты ИИ: вот почему это важно

Результаты тестирования производительности являются обычной характеристикой при выпуске новых моделей ИИ, демонстрируя их возможности в выполнении различных общих задач, таких как школьная математика (GSM8K) или рассуждения на уровне выпускника (GPQA). Однако эти тесты часто не учитывают специфические потребности различных отраслей.

Также: ChatGPT теперь будет помнить все, что вы ему говорите — как настоящий личный помощник

Программа пионеров OpenAI

Чтобы восполнить этот пробел, OpenAI представила программу OpenAI Pioneers Program, разработанную для совершенствования разработки моделей ИИ для целевых отраслей и практических приложений. Эта инициатива представляет собой двухстороннее усилие, в рамках которого компании сотрудничают с исследователями OpenAI для создания более адаптированных оценок и доработки моделей под конкретные домены.

мы запускаем программу пионеров openai — партнерство между openai и компаниями, создающими передовые продукты ИИ, чтобы (а) интенсивно донастраивать модели, превосходящие в выполнении высокозначимых задач в специфических доменах, и (б) создавать лучшие оценки для реального мира, которые позволяют отраслям лучше… https://t.co/cCvkGmYqJd

— Brad Lightcap (@bradlightcap) 9 апреля 2025

В недавнем посте в блоге OpenAI отметила, что такие сектора, как юриспруденция, финансы, страхование, здравоохранение и бухгалтерия, не имеют всеобъемлющего источника тестов. Для решения этой проблемы OpenAI планирует сотрудничать с несколькими компаниями в каждом секторе для разработки этих оценок. Такой подход направлен не только на совершенствование разработки моделей, но и на укрепление доверия между обществом и технологиями ИИ.

Также: ИИ не упирается в стену, он просто становится слишком умным для тестов, говорят в Anthropic

Исследования выявили отсутствие отраслевых тестов как значительное препятствие для ИИ в корпоративных условиях. Например, Сильвио Саварезе, руководитель Salesforce AI Research, обсудил концепцию корпоративного общего интеллекта (EGI) в посте в блоге. EGI фокусируется на передовых решениях ИИ, адаптированных под конкретные бизнес-домены. В беседе с ZDNET он подчеркнул важность разработки тестов, оценивающих функции, специфичные для домена, как ключевого шага к достижению EGI.

Совершенствование существующих моделей

Помимо создания новых оценок, OpenAI будет работать с компаниями над доработкой существующих моделей для трех конкретных отраслевых сценариев использования с помощью метода, называемого усиленной донастройкой (RFT). OpenAI предоставит рекомендации по внедрению RFT, позволяя компаниям затем самостоятельно решать, как лучше всего развертывать эти модели, которые, по словам OpenAI, будут готовы к использованию в больших масштабах.

Также: Гонка моделей ИИ внезапно стала намного ближе, говорят ученые из Стэнфорда

Первоначальная группа, участвующая в этой программе, будет включать ограниченное число стартапов, сосредоточенных на сценариях использования с значительным реальным воздействием. Если ваша компания соответствует этим критериям, вы можете подать заявку, отправив основную информацию о компании через веб-страницу программы OpenAI Pioneers Program.

Получайте главные новости утра в вашем почтовом ящике каждый день с нашей рассылкой Tech Today.

Связанная статья
Topaz DeNoise AI: лучший инструмент для шумоподавления в 2025 году - полное руководство Topaz DeNoise AI: лучший инструмент для шумоподавления в 2025 году - полное руководство В конкурентном мире цифровой фотографии четкость изображения по-прежнему имеет первостепенное значение. Фотографы всех уровней мастерства сталкиваются с цифровым шумом, который портит отличные снимки.
Master Emerald Kaizo Nuzlocke: Ultimate Survival & Strategy Guide Master Emerald Kaizo Nuzlocke: Ultimate Survival & Strategy Guide Emerald Kaizo - один из самых грозных хаков для Pokémon ROM, которые когда-либо были придуманы. Несмотря на то, что попытка запустить Nuzlocke в разы увеличивает сложность игры, победа остается достиж
Сопроводительные письма на основе искусственного интеллекта: Экспертное руководство по подаче документов в журнал Сопроводительные письма на основе искусственного интеллекта: Экспертное руководство по подаче документов в журнал В сегодняшней конкурентной среде научных изданий составление эффективного сопроводительного письма может сыграть решающую роль в принятии вашей рукописи. Узнайте, как инструменты с искусственным интел
Комментарии (23)
WillLopez
WillLopez 12 сентября 2025 г., 1:30:33 GMT+03:00

산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐

RichardSmith
RichardSmith 27 августа 2025 г., 18:01:28 GMT+03:00

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄

JustinHarris
JustinHarris 11 августа 2025 г., 8:00:59 GMT+03:00

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄

JosephScott
JosephScott 23 апреля 2025 г., 20:47:18 GMT+03:00

OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

FrankJackson
FrankJackson 23 апреля 2025 г., 0:27:27 GMT+03:00

業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅

BrianThomas
BrianThomas 22 апреля 2025 г., 2:41:13 GMT+03:00

A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀

Вернуться к вершине
OR