Tongyi Lab presenta los modelos de voz Fun-CosyVoice 3.5 y Fun-AudioGen-VD
Hoy, Tongyi Lab ha presentado oficialmente dos modelos de generación de voz compatibles con FreeStyle: Fun-CosyVoice3.5 y Fun-AudioGen-VD. Este lanzamiento supone un cambio de paradigma en la síntesis de voz, pasando de depender de etiquetas predefinidas a un nuevo marco basado en instrucciones en lenguaje natural. Ofrece una experiencia profundamente interactiva, permitiendo a los usuarios «generar voz libremente con una sola frase».


En cuanto a la arquitectura técnica y las mejoras funcionales, Fun-CosyVoice3.5 hace hincapié en la clonación de voces multilingües y la expresión matizada, y ahora añade compatibilidad con cuatro nuevos idiomas, entre ellos el tailandés y el indonesio. Al integrar las tecnologías de aprendizaje por refuerzo DiffRO y GRPO, el modelo logra mejoras sustanciales en la prosodia y la similitud de la calidad de audio. Su tasa de error para caracteres poco frecuentes ha disminuido del 15,2 % al 5,3 %, y el retraso inicial de los paquetes se ha reducido en un 35 %. Como complemento, Fun-AudioGen-VD se centra en el diseño de sonido y el modelado de escenarios. Admite un control preciso y basado en instrucciones sobre el género, la emoción y la acústica espacial, lo que permite la simulación de escenarios complejos e integrados, desde un «villano loco» hasta el ambiente de una «cafetería ruidosa».
Desde la perspectiva de las tendencias del sector, la iniciativa de Tongyi Lab eleva la generación de voz de una simple herramienta de conversión a una herramienta de creación en toda regla. Esta capacidad de expresión digital descriptiva y programable potencia directamente sectores como el cine, los videojuegos y los avatares de IA. Reduce los costes de creación de contenidos al tiempo que amplía significativamente la riqueza semántica de la interacción entre humanos y ordenadores.
API: https://help.aliyun.com/zh/model-studio/text-to-speech?spm=a2c4g.11186623.help-menu-2400256.d_0_3_2_0.d5536a31V2tEJP
Documentación: https://help.aliyun.com/zh/model-studio/cosyvoice-clone-api?spm=a2c4g.11186623.help-menu-search-2400256.d_2
Artículo relacionado
El nuevo Roewe i6 sale al mercado por 659 000 yuanes, equipado con un procesador Snapdragon 8155 y el modelo de gran capacidad de Doubao
SAIC Roewe ha presentado hoy el nuevo Roewe i6, un sedán compacto que adopta plenamente el lenguaje visual del Roewe D7. Su característica parrilla grande y vertical y la barra luminosa horizontal se
¿Cómo proteger los bienes, los edificios y la salud personal?
En un mundo impredecible, la protección se ha convertido en una necesidad estratégica, no solo en una opción. Ya se trate de proteger las finanzas, reforzar los edificios o cuidar la salud personal, l
El navegador con IA Comet se estrena con compatibilidad total con la multitarea en el iPad
El navegador con IA de Perplexity, Comet, ha lanzado oficialmente su versión para iPad, ahora totalmente compatible con iPadOS. La actualización introduce la navegación en múltiples ventanas, compatib
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
Hoy,


En cuanto a la arquitectura técnica y las mejoras funcionales,
Desde la perspectiva de las tendencias del sector, la iniciativa
API: https://help.aliyun.com/zh/model-studio/text-to-speech?spm=a2c4g.11186623.help-menu-2400256.d_0_3_2_0.d5536a31V2tEJP
Documentación: https://help.aliyun.com/zh/model-studio/cosyvoice-clone-api?spm=a2c4g.11186623.help-menu-search-2400256.d_2
El nuevo Roewe i6 sale al mercado por 659 000 yuanes, equipado con un procesador Snapdragon 8155 y el modelo de gran capacidad de Doubao
SAIC Roewe ha presentado hoy el nuevo Roewe i6, un sedán compacto que adopta plenamente el lenguaje visual del Roewe D7. Su característica parrilla grande y vertical y la barra luminosa horizontal se
¿Cómo proteger los bienes, los edificios y la salud personal?
En un mundo impredecible, la protección se ha convertido en una necesidad estratégica, no solo en una opción. Ya se trate de proteger las finanzas, reforzar los edificios o cuidar la salud personal, l
El navegador con IA Comet se estrena con compatibilidad total con la multitarea en el iPad
El navegador con IA de Perplexity, Comet, ha lanzado oficialmente su versión para iPad, ahora totalmente compatible con iPadOS. La actualización introduce la navegación en múltiples ventanas, compatib





Hogar






