Tongyi Lab представляет речевые модели Fun-CosyVoice 3.5 и Fun-AudioGen-VD
Сегодня компания Tongyi Lab официально представила две модели генерации речи с поддержкой технологии FreeStyle: Fun-CosyVoice3.5 и Fun-AudioGen-VD. Этот запуск знаменует собой смену парадигмы в области синтеза речи: от зависимости от заранее заданных тегов к новой архитектуре, основанной на инструкциях на естественном языке. Это обеспечивает высокую степень интерактивности, позволяя пользователям «свободно генерировать речь с помощью одного предложения».


Что касается технической архитектуры и функциональных улучшений, Fun-CosyVoice3.5 делает акцент на многоязычном клонировании голоса и нюансированной экспрессии, теперь добавляя поддержку четырех новых языков, включая тайский и индонезийский. Благодаря интеграции технологий реинфорсмент-обучения DiffRO и GRPO модель добилась существенных улучшений в просодии и сходстве качества звука. Показатель ошибок для редких символов снизился с 15,2% до 5,3%, а начальная задержка пакетов сократилась на 35%. В дополнение к этому Fun-AudioGen-VD фокусируется на звуковом дизайне и моделировании сценариев. Он поддерживает точное управление полом, эмоциями и пространственной акустикой на основе инструкций, позволяя моделировать сложные интегрированные сценарии — от образа «сумасшедшего злодея» до атмосферы «шумного кафе».
С точки зрения тенденций в отрасли, инициатива Tongyi Lab поднимает генерацию речи с уровня простого инструмента преобразования до уровня полноценного инструмента создания. Эта возможность описательного и программируемого цифрового выражения напрямую расширяет возможности таких секторов, как кино, игры и аватары ИИ. Она снижает затраты на создание контента, одновременно значительно расширяя семантическое богатство взаимодействия человека с компьютером.
API: https://help.aliyun.com/zh/model-studio/text-to-speech?spm=a2c4g.11186623.help-menu-2400256.d_0_3_2_0.d5536a31V2tEJP
Документация: https://help.aliyun.com/zh/model-studio/cosyvoice-clone-api?spm=a2c4g.11186623.help-menu-search-2400256.d_2
Связанная статья
Заметки Талата по искусственному интеллекту хранятся прямо на вашем устройстве, а не в облаке
Granola — приложение для ведения заметок на базе искусственного интеллекта, оцениваемое в 250 миллионов долларов, — завоевало популярность среди основателей технологических компаний и венчурных инвест
Новый Roewe i6 поступил в продажу по цене 659 000 юаней; в его основе лежат процессор Snapdragon 8155 и большая модель Doubao
Сегодня компания SAIC Roewe представила новый Roewe i6 — компактный седан, полностью воплотивший в себе стилистику модели Roewe D7. Характерная большая вертикальная решетка радиатора и горизонтальная
Как защитить имущество, здания и собственное здоровье?
В этом непредсказуемом мире защита стала стратегической необходимостью, а не просто одним из возможных вариантов. Будь то обеспечение финансовой безопасности, укрепление зданий или забота о собственно
Рекомендации по связанным специальным темам
Комментарии (0)
Сегодня


Что касается технической архитектуры и функциональных улучшений,
С точки зрения тенденций в отрасли, инициатива
API: https://help.aliyun.com/zh/model-studio/text-to-speech?spm=a2c4g.11186623.help-menu-2400256.d_0_3_2_0.d5536a31V2tEJP
Документация: https://help.aliyun.com/zh/model-studio/cosyvoice-clone-api?spm=a2c4g.11186623.help-menu-search-2400256.d_2
Заметки Талата по искусственному интеллекту хранятся прямо на вашем устройстве, а не в облаке
Granola — приложение для ведения заметок на базе искусственного интеллекта, оцениваемое в 250 миллионов долларов, — завоевало популярность среди основателей технологических компаний и венчурных инвест
Новый Roewe i6 поступил в продажу по цене 659 000 юаней; в его основе лежат процессор Snapdragon 8155 и большая модель Doubao
Сегодня компания SAIC Roewe представила новый Roewe i6 — компактный седан, полностью воплотивший в себе стилистику модели Roewe D7. Характерная большая вертикальная решетка радиатора и горизонтальная
Как защитить имущество, здания и собственное здоровье?
В этом непредсказуемом мире защита стала стратегической необходимостью, а не просто одним из возможных вариантов. Будь то обеспечение финансовой безопасности, укрепление зданий или забота о собственно





Дом






