вариант
Дом
Новости
Openai Advocates для ориентированных на отраслевые тесты ИИ: вот почему это важно

Openai Advocates для ориентированных на отраслевые тесты ИИ: вот почему это важно

15 апреля 2025 г.
200

Openai Advocates для ориентированных на отраслевые тесты ИИ: вот почему это важно

Результаты тестирования производительности являются обычной характеристикой при выпуске новых моделей ИИ, демонстрируя их возможности в выполнении различных общих задач, таких как школьная математика (GSM8K) или рассуждения на уровне выпускника (GPQA). Однако эти тесты часто не учитывают специфические потребности различных отраслей.

Также: ChatGPT теперь будет помнить все, что вы ему говорите — как настоящий личный помощник

Программа пионеров OpenAI

Чтобы восполнить этот пробел, OpenAI представила программу OpenAI Pioneers Program, разработанную для совершенствования разработки моделей ИИ для целевых отраслей и практических приложений. Эта инициатива представляет собой двухстороннее усилие, в рамках которого компании сотрудничают с исследователями OpenAI для создания более адаптированных оценок и доработки моделей под конкретные домены.

мы запускаем программу пионеров openai — партнерство между openai и компаниями, создающими передовые продукты ИИ, чтобы (а) интенсивно донастраивать модели, превосходящие в выполнении высокозначимых задач в специфических доменах, и (б) создавать лучшие оценки для реального мира, которые позволяют отраслям лучше… https://t.co/cCvkGmYqJd

— Brad Lightcap (@bradlightcap) 9 апреля 2025

В недавнем посте в блоге OpenAI отметила, что такие сектора, как юриспруденция, финансы, страхование, здравоохранение и бухгалтерия, не имеют всеобъемлющего источника тестов. Для решения этой проблемы OpenAI планирует сотрудничать с несколькими компаниями в каждом секторе для разработки этих оценок. Такой подход направлен не только на совершенствование разработки моделей, но и на укрепление доверия между обществом и технологиями ИИ.

Также: ИИ не упирается в стену, он просто становится слишком умным для тестов, говорят в Anthropic

Исследования выявили отсутствие отраслевых тестов как значительное препятствие для ИИ в корпоративных условиях. Например, Сильвио Саварезе, руководитель Salesforce AI Research, обсудил концепцию корпоративного общего интеллекта (EGI) в посте в блоге. EGI фокусируется на передовых решениях ИИ, адаптированных под конкретные бизнес-домены. В беседе с ZDNET он подчеркнул важность разработки тестов, оценивающих функции, специфичные для домена, как ключевого шага к достижению EGI.

Совершенствование существующих моделей

Помимо создания новых оценок, OpenAI будет работать с компаниями над доработкой существующих моделей для трех конкретных отраслевых сценариев использования с помощью метода, называемого усиленной донастройкой (RFT). OpenAI предоставит рекомендации по внедрению RFT, позволяя компаниям затем самостоятельно решать, как лучше всего развертывать эти модели, которые, по словам OpenAI, будут готовы к использованию в больших масштабах.

Также: Гонка моделей ИИ внезапно стала намного ближе, говорят ученые из Стэнфорда

Первоначальная группа, участвующая в этой программе, будет включать ограниченное число стартапов, сосредоточенных на сценариях использования с значительным реальным воздействием. Если ваша компания соответствует этим критериям, вы можете подать заявку, отправив основную информацию о компании через веб-страницу программы OpenAI Pioneers Program.

Получайте главные новости утра в вашем почтовом ящике каждый день с нашей рассылкой Tech Today.

Связанная статья
Новый Roewe i6 поступил в продажу по цене 659 000 юаней; в его основе лежат процессор Snapdragon 8155 и большая модель Doubao Новый Roewe i6 поступил в продажу по цене 659 000 юаней; в его основе лежат процессор Snapdragon 8155 и большая модель Doubao Сегодня компания SAIC Roewe представила новый Roewe i6 — компактный седан, полностью воплотивший в себе стилистику модели Roewe D7. Характерная большая вертикальная решетка радиатора и горизонтальная
Как защитить имущество, здания и собственное здоровье? Как защитить имущество, здания и собственное здоровье? В этом непредсказуемом мире защита стала стратегической необходимостью, а не просто одним из возможных вариантов. Будь то обеспечение финансовой безопасности, укрепление зданий или забота о собственно
Браузер Comet на базе искусственного интеллекта вышел на рынок с полной поддержкой многозадачности на iPad Браузер Comet на базе искусственного интеллекта вышел на рынок с полной поддержкой многозадачности на iPad Браузер Comet от Perplexity, основанный на искусственном интеллекте, официально выпустил версию для iPad, которая теперь полностью совместима с iPadOS. Обновление включает в себя многооконный режим пр
Рекомендации по связанным специальным темам
Бизнес Лучшее ПО для оптимизации цен с помощью ИИ: отслеживание конкурентов и автоматическая корректировка цен в магазине
Лучшее ПО для оптимизации цен с помощью ИИ: отслеживание конкурентов и автоматическая корректировка цен в магазине

Откройте для себя лучшее программное обеспечение 2026 года для оптимизации цен с помощью ИИ на сайте XIX.AI. В нашем тщательно подобранном списке представлены высокооцененные, революционные инструменты, которые отслеживают конкурентов и автоматически корректируют цены в вашем магазине для получения максимальной прибыли. Сравните бесплатные и платные варианты на основе реальных тестов. Получите преимущество в ценообразовании уже сейчас.

10 инструментов
xix.ai
код Лучшие системы проверки кода на основе ИИ: автоматизация обеспечения соответствия стандартам чистого кода и рефакторинг файлов в устаревших репозиториях
Лучшие системы проверки кода на основе ИИ: автоматизация обеспечения соответствия стандартам чистого кода и рефакторинг файлов в устаревших репозиториях

Откройте для себя 20 лучших рецензентов кода на базе ИИ 2026 года на XIX.AI. В нашем тщательно составленном списке представлены высокооцененные, революционные инструменты для автоматизации проверки соответствия стандартам чистого кода и рефакторинга файлов в устаревших репозиториях. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемых рейтингов. Получите преимущество ИИ уже сегодня.

10 инструментов
xix.ai
Преобразование текста в речь Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения
Лучшие приложения с функцией преобразования текста в речь на базе ИИ для детей с дислексией: помощь в обучении и повышение эффективности чтения

Откройте для себя лучшие приложения с технологией TTS на базе искусственного интеллекта 2026 года, специально отобранные для помощи людям с дислексией. В нашем рейтинге экспертов сравниваются бесплатные и платные инструменты, а также освещаются мощные функции, способствующие повышению эффективности чтения и обучения. Откройте для себя революционные решения, которые обязательно стоит попробовать, чтобы раскрыть потенциал учащихся. Начните свое путешествие на XIX.AI.

10 инструментов
xix.ai
Создание комиксов Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии
Лучшие генераторы на базе ИИ для сёнэн-манги: создавайте динамичные сцены боевых действий и эффекты энергии

Откройте для себя лучшие генераторы искусственного интеллекта для манги в стиле «сёнен» 2026 года на сайте XIX.AI. В нашем тщательно отобранном списке представлены мощные инструменты для создания динамичных сцен боевых действий и эффектных энергетических эффектов. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните создавать эпическую мангу уже сегодня!

15 инструментов
xix.ai
Бизнес Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы
Лучшие приложения для учета расходов на базе ИИ: сканируйте чеки и автоматически классифицируйте корпоративные расходы

Лучшие программы для учета расходов с ИИ 2026 года: самые популярные инструменты для сканирования чеков и автоматической классификации корпоративных расходов. Откройте для себя мощные, революционные решения для удобного управления расходами, точного финансового мониторинга и оптимизации соблюдения нормативных требований. Наш тщательно составленный и еженедельно обновляемый обзор бесплатных и платных вариантов поможет вам найти идеальный вариант. Воспользуйтесь преимуществами ИИ с помощью рекомендаций экспертов XIX.AI.

10 инструментов
xix.ai
Бизнес Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами
Лучшие инструменты для подбора персонала с помощью ИИ: отбор резюме и автоматизация планирования собеседований с кандидатами

Откройте для себя 20 лучших инструментов для рекрутинга на базе ИИ 2026 года на сайте XIX.AI. В нашем тщательно составленном списке представлены мощные, революционные решения для отбора резюме и автоматизации планирования собеседований с кандидатами. Сравните бесплатные и платные варианты с помощью реальных тестов и еженедельно обновляемого рейтинга. Найдите своего идеального помощника по подбору персонала и оптимизируйте процесс рекрутинга уже сегодня!

10 инструментов
xix.ai
Комментарии (23)
0/500
WillLopez
WillLopez 12 сентября 2025 г., 1:30:33 GMT+03:00

산업별 AI 벤치마크라... 솔직히 말해서 이미 늦은 감이 있죠. ㅋㅋ 의료나 금융 같은 분야에선 어제도 벤치마크 필요하다고 했는데, OpenAI가 이제서야 주장하다니. 뒤쳐지는 걸 인정한 건가? 🧐

RichardSmith
RichardSmith 27 августа 2025 г., 18:01:28 GMT+03:00

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It’s like trying to judge a chef by how fast they run. Industry-tailored tests make so much sense for real-world applications. Excited to see where this goes! 😄

JustinHarris
JustinHarris 11 августа 2025 г., 8:00:59 GMT+03:00

This article really opened my eyes to how generic AI benchmarks miss the mark for specific industries! It's like trying to judge a chef by how fast they can run. Excited to see tailored benchmarks evolve! 😄

JosephScott
JosephScott 23 апреля 2025 г., 20:47:18 GMT+03:00

OpenAI's push for industry-specific AI benchmarks is a breath of fresh air! Finally, someone's addressing the real-world needs of different sectors, not just generic tasks. It's about time we see AI models tailored to specific industries. Can't wait to see how this evolves! 🚀

FrankJackson
FrankJackson 23 апреля 2025 г., 0:27:27 GMT+03:00

業界固有のAIベンチマークを提唱するOpenAIの取り組みは素晴らしい!一般的なタスクだけでなく、各業界の具体的なニーズに応えるべきだと思う。この進化が楽しみです。もっと早くやってほしかったけどね😅

BrianThomas
BrianThomas 22 апреля 2025 г., 2:41:13 GMT+03:00

A OpenAI defendendo benchmarks de IA específicos para a indústria é algo incrível! Finalmente, estamos vendo um foco nas necessidades reais de cada setor, não apenas em tarefas genéricas. Estou ansioso para ver como isso vai se desenvolver. Vamos lá! 🚀

OR