Alibaba Tongyi dévoile un modèle vocal avec commande en langage naturel « FreeStyle »

Maison

Nouvelles

7 mars 2026

RogerLee

Aujourd'hui, l'équipe Speech Team d'Alibaba Tongyi Lab a présenté deux modèles révolutionnaires de génération vocale : Fun-CosyVoice3.5 et Fun-AudioGen-VD. La caractéristique distinctive de ces modèles est leur prise en charge des commandes « FreeStyle ». Au lieu de procéder à des réglages complexes des paramètres, les utilisateurs peuvent contrôler avec précision les styles d'expression vocale ou créer des scènes audio complexes à partir de zéro à l'aide de descriptions simples en langage naturel.

Chaque modèle a des objectifs distincts :

Fun-CosyVoice3.5 : réplication multilingue et contrôle précis

Cette version améliorée de CosyVoice réalise des avancées majeures dans la compréhension des nuances de l'expression vocale.

Génération pilotée par commande : les utilisateurs peuvent saisir des instructions telles que « parler avec plus d'assurance » ou « ralentir avec des variations émotionnelles » pour des ajustements vocaux en temps réel.

Extension linguistique : la prise en charge supplémentaire du thaï, de l'indonésien, du portugais et du vietnamien permet de maintenir des performances de pointe en matière de précision de transcription (WER) et de similitude vocale dans 13 langues.

Optimisation des caractères rares : une formation spécialisée a permis de réduire le taux d'erreur pour les caractères peu courants de 15,2 % à 5,3 %.

Amélioration des performances : la latence du premier paquet a été réduite de 35 %, ce qui améliore considérablement la fluidité des interactions en temps réel.

Fun-AudioGen-VD : conception sonore complète

Ce modèle agit comme un « directeur audio », générant un son intégré combinant « personnages + environnements ».

Personnalisation de la voix : spécifiez le sexe, l'âge, l'accent et des caractéristiques détaillées telles que les voix « rauques, graves ou basses ».

Émotions et jeux de rôle : simule des rôles tels que ceux d'agents du service clientèle, de présentateurs et d'enfants, et transmet même des états complexes tels que « calme extérieur et tension intérieure ».

Environnements immersifs : ajoute des sons d'arrière-plan (chaos du champ de bataille, murmures dans un café) et des effets spatiaux (réverbération dans une cathédrale, acoustique sous-marine) pour une simulation spatiale complète.

Tongyi Lab note que ces modèles démocratiseront la création de voix de haute qualité, offrant un puissant soutien IA pour le podcasting, le développement de jeux et la post-production cinématographique.

Article connexe

Conntour lève 7 millions de dollars auprès de General Catalyst et Y Combinator pour sa solution de recherche vidéo de sécurité basée sur l'IA Le secteur des technologies de surveillance fait actuellement l'objet d'une attention particulière, mais pas pour les meilleures raisons. Des controverses ont éclaté après que l'agence américaine de l

Le premier matériel d'IA d'Apple dévoilé : les AirPods équipés d'une caméra entrent en phase de test Les ambitions d'Apple en matière de matériel d'IA se précisent. Le célèbre journaliste spécialisé dans les technologies Mark Gurman rapporte que les AirPods tant attendus, dotés de caméras i

iOS 27 lancera une application Siri autonome dotée d'une interface de chatbot À moins d'un mois de la Conférence mondiale des développeurs (WWDC) 2026 d'Apple, le célèbre journaliste spécialisé dans les technologies Mark Gurman a dévoilé de nouvelles informations conc

Recommandations de sujets spéciaux liés

chatbot

Les meilleurs générateurs d'IA pour créer une petite amie sur mesure : concevez des personnalités, des loisirs et des histoires personnelles uniques

Découvrez les meilleurs générateurs personnalisés de « copines IA » de 2026 sur XIX.AI. Parcourez notre sélection triée sur le volet et très bien notée pour créer des personnalités, des passe-temps et des histoires personnelles uniques. Comparez les options gratuites et payantes grâce à des avis concrets. Trouvez dès aujourd'hui votre compagnon créatif idéal.

10 outils

xix.ai

Productivité

Concepteurs d'architectures IA : concevez des architectures système évolutives à l'aide du langage naturel

Découvrez les meilleurs outils de conception d'architectures d'IA de 2026 sur XIX.AI. Notre sélection des outils les mieux notés propose des solutions puissantes et révolutionnaires pour créer des architectures système évolutives à l'aide du langage naturel. Comparez les options gratuites et payantes grâce à des avis concrets. Tirez pleinement parti de votre avantage en matière d'IA et optimisez votre développement dès aujourd'hui.

10 outils

xix.ai

Création de bande dessinée

Créateurs de profils de personnages AI : générer des histoires de fond détaillées et des références visuelles pour les personnages principaux des mangas

2026 : Les meilleurs outils pour créer des profils de personnages AI : Découvrez des outils hautement réputés qui vous permettent de générer des histoires détaillées et des références visuelles pour vos personnages principaux dans les mangas. Notre liste, mise à jour chaque semaine, compare les options gratuites et payantes sur la base d’essais réels. Trouvez des solutions puissantes qui transformeront votre processus créatif et vous aideront à créer des personnages captivants. Explorez le classement sur XIX.AI et découvrez dès aujourd’hui l’allié idéal pour votre narration.

10 outils

xix.ai

Santé et bien-être

Assistants IA pour la grossesse : créez des programmes d'entraînement et de nutrition sûrs, adaptés à chaque trimestre

Découvrez les meilleurs assistants de grossesse basés sur l'IA pour 2026, qui vous proposent des programmes d'entraînement et des plans nutritionnels personnalisés et sans risque, trimestre par trimestre. Bénéficiez de recommandations triées sur le volet et très bien notées, accompagnées de comparaisons entre les options gratuites et payantes ainsi que d'avis concrets. Vivez une grossesse en pleine forme grâce au guide d'experts de XIX.AI. Découvrez-le dès maintenant.

10 outils

xix.ai

en écrivant

Les meilleurs outils gratuits d'écriture IA indétectables : transformez des brouillons robotiques en textes naturels, dignes d'un humain

Découvrez les meilleurs générateurs de texte IA gratuits et indétectables de 2026 sur XIX.AI. Notre sélection rigoureuse des meilleurs outils vous aide à transformer des brouillons robotiques en textes naturels, dignes d'un humain. Comparez les options gratuites et payantes grâce à des tests concrets et à des classements mis à jour chaque semaine. Prenez dès aujourd'hui une longueur d'avance en matière de rédaction IA.

10 outils

xix.ai

Édition d'images

Generateurs d'art par intelligence artificielle pour storyboards de courts drames : personnages de fantasy et de romance urbaine

2026 : Découvrez les meilleurs générateurs d’art artificiel pour les storyboards de courts métrages. Notre liste sélectionnée présente des outils hautement réputés pour créer des personnages captivants dans les genres fantasy et romance urbaine. Comparez les options gratuites et payantes, consultez les résultats de tests réels et trouvez le partenaire créatif idéal pour vous. Recevez chaque semaine des classements mis à jour et des conseils d’experts de XIX.AI. Commencez dès aujourd’hui à visualiser votre histoire !

10 outils

xix.ai