DeepL, известная своими услугами по переводу текстов, теперь занимается переводом речи

DeepL, компания-переводчик, наиболее известная своими инструментами для перевода текстов, сегодня представила набор решений для перевода «голос-голос», предназначенный для таких сценариев, как встречи, мобильные и веб-беседы, а также групповые обсуждения для сотрудников, работающих с клиентами, с помощью специализированных приложений. Компания также представила API, позволяющий сторонним разработчикам и предприятиям использовать технологию DeepL для создания решений под конкретные задачи, например для call-центров.
«После стольких лет, посвященных переводу текстов, голосовой перевод стал для нас естественным следующим шагом», — сказал генеральный директор DeepL Ярек Кутыловски в интервью TechCrunch. «Мы добились значительного прогресса в переводе текстов и документов. Но мы чувствовали, что на рынке не было хорошего продукта для перевода речи в реальном времени».
Кутыловски пояснил, что основная сложность при разработке продукта для перевода в реальном времени заключается в поиске правильного баланса между сокращением задержки — времени между моментом, когда кто-то говорит, и моментом, когда слышен переведенный звук — и поддержанием высокой точности.
DeepL выпускает надстройки для таких платформ, как Zoom и Microsoft Teams, где слушатели могут либо слышать перевод в режиме реального времени, пока другие говорят на своих родных языках, либо следить за текстом перевода на экране. В настоящее время эта программа доступна в рамках раннего доступа, и компания приглашает организации вступить в список ожидания. DeepL также предлагает продукт для мобильных и веб-бесед, проводимых как лично, так и удаленно.
DeepL также позволяет пользователям участвовать в групповых беседах в таких условиях, как учебные сессии или семинары, позволяя участникам присоединяться через QR-код.
DeepL заявляет, что ее технология «голос-в-голос» может обучаться и адаптироваться к пользовательскому словарю, включая отраслевые термины, а также названия компаний и имена людей.
Кутиловски отметил, что ИИ изменит сферу обслуживания клиентов в ближайшие годы. Он указал, что уровень перевода помогает компаниям предоставлять поддержку на языках, на которых квалифицированный персонал является дефицитным и дорогостоящим.
Компания заявляет, что контролирует весь стек «голос-в-голос». Однако текущая система преобразует речь в текст, применяет перевод, а затем преобразует текст обратно в речь. DeepL считает, что многолетний опыт работы в области текстового перевода дает ей преимущество в качестве перевода. В перспективе компания нацелена на разработку модели сквозного голосового перевода, полностью обходящей этап преобразования в текст.
DeepL сталкивается с конкуренцией со стороны нескольких хорошо финансируемых стартапов, работающих в смежных областях. Компания Sanas, которая в прошлом году привлекла 65 миллионов долларов от Quadrille Capital и Teleperformance, использует ИИ для изменения акцента говорящего в режиме реального времени — это инструмент, предназначенный в первую очередь для операторов колл-центров.
Компания Camb.AI из Дубая специализируется на синтезе речи и переводе для медиа- и развлекательных компаний, включая Amazon Web Services, помогая им дублировать и локализовать видеоконтент в больших объемах.
Palabra, поддерживаемая фирмой Seven Seven Six соучредителя Reddit Алексиса Оханяна, создает движок перевода речи в реальном времени, предназначенный для сохранения как смысла, так и оригинального голоса говорящего, что ставит ее в более прямую конкуренцию с тем, что сейчас создает DeepL.
Связанная статья
ElevenLabs объявила о привлечении в качестве новых инвесторов компаний BlackRock, Джейми Фокса и Евы Лонгории
Компания ElevenLabs, занимающаяся разработкой голосовых ИИ-технологий, раскрыла имена дополнительных инвесторов, участвовавших в раунде финансирования серии D на сумму 500 млн долларов, о котором перв
Mistral представляет модель генерации речи с открытым исходным кодом
Французская компания Mistral, специализирующаяся на искусственном интеллекте, представила в четверг новую модель преобразования текста в речь с открытым исходным кодом, предназначенную для голосовых И
Лучшие приложения для диктовки с ИИ: обзоры экспертов и рейтинги
Приложения для диктовки на базе ИИ за относительно короткий срок добились впечатляющих успехов. Долгое время они работали медленно и часто допускали ошибки, требуя от пользователей говорить с определе
Рекомендации по связанным специальным темам
Комментарии (0)

DeepL, компания-переводчик, наиболее известная своими инструментами для перевода текстов, сегодня представила набор решений для перевода «голос-голос», предназначенный для таких сценариев, как встречи, мобильные и веб-беседы, а также групповые обсуждения для сотрудников, работающих с клиентами, с помощью специализированных приложений. Компания также представила API, позволяющий сторонним разработчикам и предприятиям использовать технологию DeepL для создания решений под конкретные задачи, например для call-центров.
«После стольких лет, посвященных переводу текстов, голосовой перевод стал для нас естественным следующим шагом», — сказал генеральный директор DeepL Ярек Кутыловски в интервью TechCrunch. «Мы добились значительного прогресса в переводе текстов и документов. Но мы чувствовали, что на рынке не было хорошего продукта для перевода речи в реальном времени».
Кутыловски пояснил, что основная сложность при разработке продукта для перевода в реальном времени заключается в поиске правильного баланса между сокращением задержки — времени между моментом, когда кто-то говорит, и моментом, когда слышен переведенный звук — и поддержанием высокой точности.
DeepL выпускает надстройки для таких платформ, как Zoom и Microsoft Teams, где слушатели могут либо слышать перевод в режиме реального времени, пока другие говорят на своих родных языках, либо следить за текстом перевода на экране. В настоящее время эта программа доступна в рамках раннего доступа, и компания приглашает организации вступить в список ожидания. DeepL также предлагает продукт для мобильных и веб-бесед, проводимых как лично, так и удаленно.
DeepL также позволяет пользователям участвовать в групповых беседах в таких условиях, как учебные сессии или семинары, позволяя участникам присоединяться через QR-код.
DeepL заявляет, что ее технология «голос-в-голос» может обучаться и адаптироваться к пользовательскому словарю, включая отраслевые термины, а также названия компаний и имена людей.
Кутиловски отметил, что ИИ изменит сферу обслуживания клиентов в ближайшие годы. Он указал, что уровень перевода помогает компаниям предоставлять поддержку на языках, на которых квалифицированный персонал является дефицитным и дорогостоящим.
Компания заявляет, что контролирует весь стек «голос-в-голос». Однако текущая система преобразует речь в текст, применяет перевод, а затем преобразует текст обратно в речь. DeepL считает, что многолетний опыт работы в области текстового перевода дает ей преимущество в качестве перевода. В перспективе компания нацелена на разработку модели сквозного голосового перевода, полностью обходящей этап преобразования в текст.
DeepL сталкивается с конкуренцией со стороны нескольких хорошо финансируемых стартапов, работающих в смежных областях. Компания Sanas, которая в прошлом году привлекла 65 миллионов долларов от Quadrille Capital и Teleperformance, использует ИИ для изменения акцента говорящего в режиме реального времени — это инструмент, предназначенный в первую очередь для операторов колл-центров.
Компания Camb.AI из Дубая специализируется на синтезе речи и переводе для медиа- и развлекательных компаний, включая Amazon Web Services, помогая им дублировать и локализовать видеоконтент в больших объемах.
Palabra, поддерживаемая фирмой Seven Seven Six соучредителя Reddit Алексиса Оханяна, создает движок перевода речи в реальном времени, предназначенный для сохранения как смысла, так и оригинального голоса говорящего, что ставит ее в более прямую конкуренцию с тем, что сейчас создает DeepL.
ElevenLabs объявила о привлечении в качестве новых инвесторов компаний BlackRock, Джейми Фокса и Евы Лонгории
Компания ElevenLabs, занимающаяся разработкой голосовых ИИ-технологий, раскрыла имена дополнительных инвесторов, участвовавших в раунде финансирования серии D на сумму 500 млн долларов, о котором перв
Mistral представляет модель генерации речи с открытым исходным кодом
Французская компания Mistral, специализирующаяся на искусственном интеллекте, представила в четверг новую модель преобразования текста в речь с открытым исходным кодом, предназначенную для голосовых И
Лучшие приложения для диктовки с ИИ: обзоры экспертов и рейтинги
Приложения для диктовки на базе ИИ за относительно короткий срок добились впечатляющих успехов. Долгое время они работали медленно и часто допускали ошибки, требуя от пользователей говорить с определе





Дом






