OpenAI представляет возможности голосового интеллекта в своем API

OpenAI объявила в четверг, что её API теперь включает несколько новых функций голосового интеллекта, предназначенных для помощи разработчикам в создании приложений, способных говорить, расшифровывать и переводить разговоры.
Новая модель GPT-Realtime-2 – это ещё один голосовой алгоритм, разработанный для создания реалистичной имитации человеческого голоса, способной вести беседу с пользователями. Однако, в отличие от своего предшественника (GPT-Realtime-1.5), эта версия использует логические алгоритмы класса GPT-5, которые, по словам OpenAI, позволяют обрабатывать более сложные запросы пользователей.
Компания также выпустила сервис GPT-Realtime-Translate, который, как следует из названия, предоставляет услуги реального времени по переводу и синхронизируется с действиями пользователя во время беседы. Этот сервис поддерживает более 70 языков входа и 13 языков выхода.
Кроме того, была представлена новая функция расшифровки речи GPT-Realtime-Whisper, которая позволяет превращать речь в текст в реальном времени по мере её произнесения.
“Все эти модели позволяют переводить аудиоинформацию в реальном времени, делая голосовые интерфейсы способными не только слушать и размышлять, но и выполнять такие действия, как перевод и расшифровка текста по мере развития беседы“, – говорит компания.
Кому принесут пользу эти обновления? Очевидной целевой аудиторией являются компании, стремящиеся расширить возможности своих сервисов по обслуживанию клиентов. Однако OpenAI также отмечает, что новые функции могут быть полезны в различных сферах – образовании, медиа, организации мероприятий и на платформах для создателей контента.
Несмотря на то что эти инструменты очень полезны с точки зрения бизнеса, существует риск их злоупотребления. Компания приняла меры предосторожности, чтобы предотвратить использование новых функций в целях спама, мошенничества или других форм онлайн-злоупотреблений. В систему были встроены специальные механизмы, позволяющие прерывать беседу, если она нарушает правила по содержанию контента, установленные OpenAI.
Все новые голосовые модели включены в Realtime API от OpenAI. Сервисы Translate и Whisper оплачиваются за минуту использования, в то время как GPT-Realtime-2 расчетывается исходя из количества потребленных токенов.
Связанная статья
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей
В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
Грег Брокман рассказывает, как Илон Маск покинул OpenAI
В конце августа 2017 года ключевые фигуры OpenAI — на тот момент небольшой некоммерческой исследовательской лаборатории — собрались, чтобы обсудить, как создать коммерческую структуру для продвижения
Пентагон заключил соглашения с Nvidia, Microsoft и AWS о внедрении технологий искусственного интеллекта в секретные сети.
После предыдущих соглашений с Google, SpaceX и OpenAI, Министерство обороны США в пятницу объявило о подписании договоров с Nvidia, Microsoft, Amazon Web Services и Reflection AI о использовании их технологий и моделей искусственного интеллекта в сек
Рекомендации по связанным специальным темам
Комментарии (0)

OpenAI объявила в четверг, что её API теперь включает несколько новых функций голосового интеллекта, предназначенных для помощи разработчикам в создании приложений, способных говорить, расшифровывать и переводить разговоры.
Новая модель GPT-Realtime-2 – это ещё один голосовой алгоритм, разработанный для создания реалистичной имитации человеческого голоса, способной вести беседу с пользователями. Однако, в отличие от своего предшественника (GPT-Realtime-1.5), эта версия использует логические алгоритмы класса GPT-5, которые, по словам OpenAI, позволяют обрабатывать более сложные запросы пользователей.
Компания также выпустила сервис GPT-Realtime-Translate, который, как следует из названия, предоставляет услуги реального времени по переводу и синхронизируется с действиями пользователя во время беседы. Этот сервис поддерживает более 70 языков входа и 13 языков выхода.
Кроме того, была представлена новая функция расшифровки речи GPT-Realtime-Whisper, которая позволяет превращать речь в текст в реальном времени по мере её произнесения.
“Все эти модели позволяют переводить аудиоинформацию в реальном времени, делая голосовые интерфейсы способными не только слушать и размышлять, но и выполнять такие действия, как перевод и расшифровка текста по мере развития беседы“, – говорит компания.
Кому принесут пользу эти обновления? Очевидной целевой аудиторией являются компании, стремящиеся расширить возможности своих сервисов по обслуживанию клиентов. Однако OpenAI также отмечает, что новые функции могут быть полезны в различных сферах – образовании, медиа, организации мероприятий и на платформах для создателей контента.
Несмотря на то что эти инструменты очень полезны с точки зрения бизнеса, существует риск их злоупотребления. Компания приняла меры предосторожности, чтобы предотвратить использование новых функций в целях спама, мошенничества или других форм онлайн-злоупотреблений. В систему были встроены специальные механизмы, позволяющие прерывать беседу, если она нарушает правила по содержанию контента, установленные OpenAI.
Все новые голосовые модели включены в Realtime API от OpenAI. Сервисы Translate и Whisper оплачиваются за минуту использования, в то время как GPT-Realtime-2 расчетывается исходя из количества потребленных токенов.
OpenAI описывает экономику искусственного интеллекта с участием государственных инвестиционных фондов, налогами на роботов и четырехдневной рабочей неделей
В то время как правительства пытаются справиться с экономическими последствиями появления сверхинтеллектуальных машин, компания OpenAI опубликовала ряд предложений по формированию политики, в которых
Грег Брокман рассказывает, как Илон Маск покинул OpenAI
В конце августа 2017 года ключевые фигуры OpenAI — на тот момент небольшой некоммерческой исследовательской лаборатории — собрались, чтобы обсудить, как создать коммерческую структуру для продвижения
Пентагон заключил соглашения с Nvidia, Microsoft и AWS о внедрении технологий искусственного интеллекта в секретные сети.
После предыдущих соглашений с Google, SpaceX и OpenAI, Министерство обороны США в пятницу объявило о подписании договоров с Nvidia, Microsoft, Amazon Web Services и Reflection AI о использовании их технологий и моделей искусственного интеллекта в сек





Дом






