вариант
Дом
Новости
Fish Audio представляет S2: модель с открытым исходным кодом, позволяющая управлять эмоциями на уровне отдельных слов

Fish Audio представляет S2: модель с открытым исходным кодом, позволяющая управлять эмоциями на уровне отдельных слов

7 апреля 2026 г.
119

Fish Audio представляет S2: модель с открытым исходным кодом, позволяющая управлять эмоциями на уровне отдельных слов

Компания Fish Audio официально представила свою новую модель преобразования текста в речь S2, которая стала значительным шагом вперед в плане выразительности и управляемости для технологий TTS с открытым исходным кодом.

Модель под названием Fish Audio S2 уделяет приоритетное внимание мощному контролю эмоций. Пользователи могут выполнять точную настройку просодии и эмоций с помощью команд на естественном языке. Вставляя теги, такие как [laugh], [whisper] или [super happy], или даже используя описания в свободной форме, например [professional broadcast tone] или [pitch up], можно осуществлять точное управление на уровне отдельных слов для генерации высоковыразительной и естественно-живой речи.

Ключевые особенности:

Полностью открытый исходный код: веса модели, код тонкой настройки и потоковый механизм вывода на основе SGLang доступны для общего пользования на GitHub и Hugging Face. S2-Pro — это флагманская версия с примерно 4,4 миллиардами параметров. Сверхнизкая задержка: задержка инференции составляет менее 150 миллисекунд, что делает ее идеальной для приложений реального времени, таких как чат-боты и виртуальные стримеры. Встроенная поддержка нескольких говорящих: она может обрабатывать нескольких говорящих в рамках одной инференции, управляя ходами разговора, перебиваниями и естественной передачей эмоций, сохраняя при этом стабильное качество голоса без дополнительной обработки.

Fish Audio сообщает, что S2 был обучен на примерно 10 миллионах часов аудиоданных, охватывающих почти 50 языков. Используя выравнивание с помощью обучения с подкреплением и двойную авторегрессионную архитектуру, он демонстрирует ведущую естественность и выразительность в нескольких тестах. Он считается одной из самых эмоционально интеллектуальных систем TTS, доступных как с открытым исходным кодом, так и проприетарных. «Настоящая лингвистическая свобода начинается сейчас», — объявила Fish Audio, отметив появление речи ИИ с подлинными эмоциями и индивидуальностью.

GitHub:https://github.com/fishaudio/fish-speech/

HuggingFace:https://huggingface.co/fishaudio/s2-pro/

Связанная статья
Snowflake инвестирует более 600 млн долларов в разработку специализированных чипов для AWS в рамках продвижения ИИ в корпоративном секторе Snowflake инвестирует более 600 млн долларов в разработку специализированных чипов для AWS в рамках продвижения ИИ в корпоративном секторе Snowflake, гигант в сфере облачных данных, объявил о планах инвестировать более 600 миллионов долларов в течение следующих шести лет в приобретение процессоров серии Graviton и ускорителей искусственн
China Telecom инвестирует в Mianbi Intelligence, увеличив капитал до 713 000 юаней для развития больших языковых моделей и инфраструктуры обработки данных China Telecom инвестирует в Mianbi Intelligence, увеличив капитал до 713 000 юаней для развития больших языковых моделей и инфраструктуры обработки данных «Национальная команда» и ведущий специалист из Университета Цинхуа в сфере крупных моделей углубляют свое стратегическое сотрудничество. 1 марта 2026 года, согласно последним данным о регистрации пред
Группа Taotian ускоряет реструктуризацию с ориентацией на искусственный интеллект и предоставляет стажерам бесплатные квоты на токены Группа Taotian ускоряет реструктуризацию с ориентацией на искусственный интеллект и предоставляет стажерам бесплатные квоты на токены Группа TaoTian недавно представила «План повышения производительности с помощью ИИ», призванный ускорить интеграцию технологий искусственного интеллекта в операционную деятельность в сфере электронной
Рекомендации по связанным специальным темам
письмо Лучшие помощники по жанрам «сянься» и «уся» на базе ИИ: создавайте эпические истории о духовном росте и хореографию боевых искусств
Лучшие помощники по жанрам «сянься» и «уся» на базе ИИ: создавайте эпические истории о духовном росте и хореографию боевых искусств

Откройте для себя лучшие ИИ-помощники 2026 года для создания эпических историй в жанрах сянься и уся. В тщательно подобранном списке XIX.AI представлены самые популярные и революционные инструменты, которые помогут вам освоить систему развития персонажей и постановку боевых сцен. Сравните бесплатные и платные варианты на основе реальных тестов. Раскройте свой творческий потенциал и начните писать уже сегодня!

10 инструментов
xix.ai
код Инструменты для программирования мобильных приложений на основе технологий ИИ: генерация кода для платформFlutter и React Native на основе вводимых пользователем данных
Инструменты для программирования мобильных приложений на основе технологий ИИ: генерация кода для платформFlutter и React Native на основе вводимых пользователем данных

Откройте для себя лучшие инструменты для программирования в области искусственного интеллекта на мобильных устройствах в 2026 году, подходящие для использования с фреймворками Flutter и React Native. Наш отобранный список включает мощные решения, способные изменить ход разработки приложений, позволяющие генерировать код, работающий на различных платформах, на основе предоставленных инструкций. Сравните бесплатные и платные варианты с использованием реальных примеров тестирования. Ускорьте процесс разработки и создавайте качественные приложения. Ознакомьтесь с рейтингом на сайте XIX.AI прямо сейчас!

10 инструментов
xix.ai
код Лучшие генераторы расширений для Chrome на базе ИИ: создавайте собственные надстройки для браузера без навыков программирования
Лучшие генераторы расширений для Chrome на базе ИИ: создавайте собственные надстройки для браузера без навыков программирования

Откройте для себя 20 лучших генераторов расширений для Chrome на базе ИИ на сайте XIX.AI. В нашем тщательно подобранном списке представлены самые популярные инструменты, которые обязательно стоит попробовать — они позволяют создавать собственные расширения для браузера без написания кода. Сравните бесплатные и платные варианты, ознакомьтесь с результатами реальных тестов и повысьте свою продуктивность. Изучите последние рейтинги и найдите идеальный инструмент уже сегодня!

10 инструментов
xix.ai
Преобразование текста в речь Лучший мультиязычный ТЗУ на основе ИИ: генерация автентичной речи с нативным акцентом более чем на 50 языках
Лучший мультиязычный ТЗУ на основе ИИ: генерация автентичной речи с нативным акцентом более чем на 50 языках

Откройте для себя лучшие инструменты искусственного интеллекта для мультиязычной технологии голосового текстового редактирования 2026 года, которые позволяют воспроизводить речь с натуральным акцентом на более чем 50 языках. Исследуйте нашу тщательно подготовленную классификацию, в которой представлены сравнения бесплатных и платных версий инструментов, а также результаты реальных тестов. Найдите идеальный инструмент для голосового текстового редактирования на сайте XIX.AI и раскройте для себя возможности глобальной коммуникации прямо сегодня.

10 инструментов
xix.ai
Помощник по встречам Лучшие инструменты автоматизации встреч на основе искусственного интеллекта для более эффективного и быстрого сотрудничества
Лучшие инструменты автоматизации встреч на основе искусственного интеллекта для более эффективного и быстрого сотрудничества

Откройте для себя самые новые и популярные инструменты автоматизации встреч на основе технологий ИИ 2026 года, которые помогут улучшить и ускорить сотрудничество. Наш отобранный список включает мощные решения, способные радикально изменить процесс работы с записями, резюме и планами действий. Сравните бесплатные и платные варианты на основе реальных тестов и еженедельно обновляемых рейтингов. Раскройте потенциал вашей команды! Ознакомьтесь с лучшими выборами прямо на сайте XIX.AI.

10 инструментов
xix.ai
Быстрый Подсказки ИИ для «инфраструктуры как кода»: безопасное развертывание конфигураций Terraform и Docker
Подсказки ИИ для «инфраструктуры как кода»: безопасное развертывание конфигураций Terraform и Docker

Откройте для себя лучшие AI-промпты 2026 года для «инфраструктуры как кода». Тщательно подобранная подборка от XIX.AI поможет вам безопасно развертывать конфигурации Terraform и Docker, автоматизировать настройку облачных сред и повысить эффективность DevOps. Сравните бесплатные и платные варианты на основе реальных тестов. Ознакомьтесь с ними прямо сейчас и раскройте весь потенциал искусственного интеллекта.

10 инструментов
xix.ai
Комментарии (0)
0/500
OR