вариант
Дом
Новости
Openai Advocates для ориентированных на отраслевые тесты ИИ: вот почему это важно

Openai Advocates для ориентированных на отраслевые тесты ИИ: вот почему это важно

15 апреля 2025 г.
120

Openai Advocates для ориентированных на отраслевые тесты ИИ: вот почему это важно

Результаты тестирования производительности являются обычной характеристикой при выпуске новых моделей ИИ, демонстрируя их возможности в выполнении различных общих задач, таких как школьная математика (GSM8K) или рассуждения на уровне выпускника (GPQA). Однако эти тесты часто не учитывают специфические потребности различных отраслей.

Также: ChatGPT теперь будет помнить все, что вы ему говорите — как настоящий личный помощник

Программа пионеров OpenAI

Чтобы восполнить этот пробел, OpenAI представила программу OpenAI Pioneers Program, разработанную для совершенствования разработки моделей ИИ для целевых отраслей и практических приложений. Эта инициатива представляет собой двухстороннее усилие, в рамках которого компании сотрудничают с исследователями OpenAI для создания более адаптированных оценок и доработки моделей под конкретные домены.

мы запускаем программу пионеров openai — партнерство между openai и компаниями, создающими передовые продукты ИИ, чтобы (а) интенсивно донастраивать модели, превосходящие в выполнении высокозначимых задач в специфических доменах, и (б) создавать лучшие оценки для реального мира, которые позволяют отраслям лучше… https://t.co/cCvkGmYqJd

— Brad Lightcap (@bradlightcap) 9 апреля 2025

В недавнем посте в блоге OpenAI отметила, что такие сектора, как юриспруденция, финансы, страхование, здравоохранение и бухгалтерия, не имеют всеобъемлющего источника тестов. Для решения этой проблемы OpenAI планирует сотрудничать с несколькими компаниями в каждом секторе для разработки этих оценок. Такой подход направлен не только на совершенствование разработки моделей, но и на укрепление доверия между обществом и технологиями ИИ.

Также: ИИ не упирается в стену, он просто становится слишком умным для тестов, говорят в Anthropic

Исследования выявили отсутствие отраслевых тестов как значительное препятствие для ИИ в корпоративных условиях. Например, Сильвио Саварезе, руководитель Salesforce AI Research, обсудил концепцию корпоративного общего интеллекта (EGI) в посте в блоге. EGI фокусируется на передовых решениях ИИ, адаптированных под конкретные бизнес-домены. В беседе с ZDNET он подчеркнул важность разработки тестов, оценивающих функции, специфичные для домена, как ключевого шага к достижению EGI.

Совершенствование существующих моделей

Помимо создания новых оценок, OpenAI будет работать с компаниями над доработкой существующих моделей для трех конкретных отраслевых сценариев использования с помощью метода, называемого усиленной донастройкой (RFT). OpenAI предоставит рекомендации по внедрению RFT, позволяя компаниям затем самостоятельно решать, как лучше всего развертывать эти модели, которые, по словам OpenAI, будут готовы к использованию в больших масштабах.

Также: Гонка моделей ИИ внезапно стала намного ближе, говорят ученые из Стэнфорда

Первоначальная группа, участвующая в этой программе, будет включать ограниченное число стартапов, сосредоточенных на сценариях использования с значительным реальным воздействием. Если ваша компания соответствует этим критериям, вы можете подать заявку, отправив основную информацию о компании через веб-страницу программы OpenAI Pioneers Program.

Получайте главные новости утра в вашем почтовом ящике каждый день с нашей рассылкой Tech Today.

Связанная статья
Qodo сотрудничает с Google Cloud для предоставления бесплатных инструментов AI для проверки кода разработчикам Qodo сотрудничает с Google Cloud для предоставления бесплатных инструментов AI для проверки кода разработчикам Qodo, израильский стартап в области AI-кодирования, ориентированный на качество кода, начал сотрудничество с Google Cloud для повышения целостности программного обеспечения, созданного AI.По мере рост
DeepMind's AI Secures Gold at 2025 Math Olympiad DeepMind's AI Secures Gold at 2025 Math Olympiad ИИ DeepMind достиг потрясающего прорыва в математическом мышлении, завоевав золотую медаль на Международной математической олимпиаде (IMO) 2025 года, всего через год после получения серебра в 2024 год
AI-управляемый Parallax Maker: Создание динамичных 2.5D анимаций AI-управляемый Parallax Maker: Создание динамичных 2.5D анимаций Преобразуйте статические изображения в захватывающие 2.5D анимации с помощью Parallax Maker. Этот инструмент с открытым исходным кодом позволяет художникам и разработчикам игр добавлять глубину и движ
Комментарии (21)
JustinHarris
JustinHarris 11 августа 2025 г., 8:00:59 GMT+03:00

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄

JosephScott
JosephScott 23 апреля 2025 г., 20:47:18 GMT+03:00

OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

FrankJackson
FrankJackson 23 апреля 2025 г., 0:27:27 GMT+03:00

業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅

BrianThomas
BrianThomas 22 апреля 2025 г., 2:41:13 GMT+03:00

A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀

ChristopherTaylor
ChristopherTaylor 21 апреля 2025 г., 1:32:37 GMT+03:00

¡Qué genial que OpenAI abogue por benchmarks de IA específicos de la industria! Ya era hora de que se centraran en las necesidades reales de cada sector, no solo en tareas genéricas. Estoy emocionado de ver cómo se desarrolla esto. ¡A por ello! 🚀

JonathanKing
JonathanKing 20 апреля 2025 г., 7:12:27 GMT+03:00

Me encanta cómo este herramienta enfoca los benchmarks de IA en sectores específicos. ¡Es genial para ver dónde puede tener un impacto real la IA! Aunque la interfaz podría ser más intuitiva, es esencial para cualquier persona en el campo de la IA. ¡Recomendado! 🌟

Вернуться к вершине
OR