option
Maison
Nouvelles
Tongyi, filiale d'Alibaba, dévoile Fun-CineForge : un modèle d'IA open source capable de produire une synthèse vocale de qualité cinématographique

Tongyi, filiale d'Alibaba, dévoile Fun-CineForge : un modèle d'IA open source capable de produire une synthèse vocale de qualité cinématographique

16 avril 2026
93

Le 16 mars, Alibaba Tongyi Lab a officiellement lancé et mis en open source Fun-CineForge, un modèle multimodal de synthèse vocale de qualité cinématographique adapté à de multiples scénarios. Ce modèle s'attaque aux principaux défis du doublage par IA, notamment le décalage entre les lèvres et la voix, le manque d'expression émotionnelle et l'incohérence des caractéristiques vocales entre plusieurs personnages. Il propose également une méthode de haute qualité pour la construction d'ensembles de données.

image.png

Sur le plan technique, Fun-CineForge est le pionnier du concept de « modalité temporelle ». Contrairement aux modèles conventionnels qui se concentrent uniquement sur le texte ou les visuels, il garantit que la synthèse vocale s'effectue dans des intervalles de temps précis grâce à un contrôle précis des horodatages. Même dans des scènes de film complexes comportant des personnages masqués, des changements fréquents de plan ou des visages flous, le modèle maintient un haut degré de synchronisation audiovisuelle et de respect des instructions.

Le pipeline de construction de l'ensemble de données open source CineDub qui l'accompagne constitue une autre innovation majeure. Le laboratoire Tongyi a utilisé le raisonnement par chaîne de pensée des grands modèles linguistiques pour transformer automatiquement les séquences brutes de films en données structurées, réduisant ainsi considérablement le besoin d'annotation manuelle. Ce processus atteint un taux d'erreur sur les mots d'environ 1 % et un taux d'erreur de diarisation des locuteurs de seulement 1,20 %, offrant ainsi une base d'entraînement hautement compétitive pour les grands modèles.

image.png

Fun-CineForge est désormais disponible sur GitHub, HuggingFace et la communauté ModelScope, et prend en charge l'inférence pour des clips vidéo d'une durée maximale de 30 secondes. Il excelle non seulement dans les monologues à locuteur unique, mais offre également une prise en charge de niveau professionnel pour les scénarios de dialogues en duo et à locuteurs multiples. Cette avancée marque l'évolution de la technologie vocale IA, qui passe de rôles basiques de service client et d'assistant à des applications de post-production cinématographique et d'animation de haut niveau.

GitHub : https://github.com/FunAudioLLM/FunCineForge

HuggingFace : https://huggingface.co/FunAudioLLM/Fun-CineForge

ModelScope : https://www.modelscope.cn/models/FunAudioLLM/Fun-CineForge/

Article connexe
Pentium 4 Revival : Un processeur vieux de 20 ans permet d’exécuter le modèle Meta Llama 3 Large Pentium 4 Revival : Un processeur vieux de 20 ans permet d’exécuter le modèle Meta Llama 3 Large Récemment, la chaîne technique YouTube Fully Buffered a mené une expérience impressionnante et poussée : elle a réussi à faire fonctionner le dernier modèle de grande taille de Meta, Llama 3.2 3B, sur un processeur Pentium 4 641, un circuit électroni
Le district de Shangcheng à Hangzhou lance les premières “Dix Mesures d’Or” audiovisuelles de Zhejiang dans le cadre du programme AIGC, avec la création d’un fonds industriel de 5 milliards de yuans. Le district de Shangcheng à Hangzhou lance les premières “Dix Mesures d’Or” audiovisuelles de Zhejiang dans le cadre du programme AIGC, avec la création d’un fonds industriel de 5 milliards de yuans. Le 16ème, la Conférence sur l’écosystème d’innovation de l’industrie audiovisuelle AIGC s’est tenue dans le district de Shangcheng à Hangzhou. Lors de cet événement, la province a dévoilé sa première politique spécifique pour l’industrie audiovisuell
Le MIIT sollicite les avis du public concernant 121 normes industrielles, y compris le protocole de contexte pour les modèles d'intelligence artificielle. Le MIIT sollicite les avis du public concernant 121 normes industrielles, y compris le protocole de contexte pour les modèles d'intelligence artificielle. Le ministère de l’Industrie et de l’Information technologique de la Chine a officiellement publié une annonce demandant aux citoyens de donner leur avis sur 121 projets de normalisation industrielle, y compris les “Exigences en matière de sécurité ap
Recommandations de sujets spéciaux liés
chatbot Créez votre propre histoire d'amour grâce à l'IA avec ces outils de jeu de rôle
Créez votre propre histoire d'amour grâce à l'IA avec ces outils de jeu de rôle

Découvrez les meilleurs outils de jeu de rôle basés sur l'IA de 2026 pour créer des récits immersifs. La sélection de XIX.AI regroupe des assistants puissants et révolutionnaires qui vous permettront de donner libre cours à votre créativité narrative et d'apporter une profondeur émotionnelle à vos récits. Comparez les options gratuites et payantes grâce à des tests concrets. Lancez-vous dès aujourd'hui dans une aventure unique.

10 outils
xix.ai
Synthèse vocale Les meilleurs outils vocaux basés sur l'IA pour les développeurs de jeux indépendants : gagnez du temps sur le doublage de vos jeux de rôle et romans visuels
Les meilleurs outils vocaux basés sur l'IA pour les développeurs de jeux indépendants : gagnez du temps sur le doublage de vos jeux de rôle et romans visuels

Découvrez les meilleurs outils vocaux basés sur l'IA pour les développeurs de jeux en 2026 ! La sélection de XIX.AI regroupe les solutions les mieux notées et les plus innovantes pour vous faire gagner du temps et de l'argent sur le doublage de vos jeux de rôle et romans visuels. Consultez nos comparatifs entre versions gratuites et payantes, nos tests en conditions réelles et nos classements mis à jour chaque semaine. Trouvez dès aujourd'hui l'outil vocal qui vous convient le mieux !

10 outils
xix.ai
Éducation et apprentissage Meilleurs outils d'entraînement par répétition espacée avec intelligence artificielle : optimisez vos programmes d'études pour les étudiants en médecine et en droit
Meilleurs outils d'entraînement par répétition espacée avec intelligence artificielle : optimisez vos programmes d'études pour les étudiants en médecine et en droit

Découvrez les meilleurs outils d’entraînement par répétition espacée en AI pour 2026, sélectionnés par XIX.AI. Nos choix phares, révolutionnaires dans leur domaine, aident les étudiants en médecine et en droit à optimiser leurs programmes de révision afin d’améliorer leur mémorisation. Comparez les options gratuites et payantes grâce à des tests concrets et aux classements mis à jour chaque semaine. Développez rapidement un avantage dans votre apprentissage.

10 outils
xix.ai
Création vidéo Les meilleures plateformes d'IA de conversion de texte en vidéo pour la rédaction de scénarios et la narration visuelle
Les meilleures plateformes d'IA de conversion de texte en vidéo pour la rédaction de scénarios et la narration visuelle

Les meilleures plateformes d'IA de conversion de texte en vidéo en 2026 : les outils les mieux notés pour la rédaction de scénarios et la narration visuelle. Découvrez des solutions puissantes et révolutionnaires pour transformer votre texte en vidéos captivantes. Comparez les options gratuites et payantes grâce à nos classements mis à jour chaque semaine et à nos tests en conditions réelles. Trouvez la plateforme idéale pour booster votre créativité et votre productivité. Découvrez notre sélection soigneusement choisie sur XIX.AI.

10 outils
xix.ai
chatbot Orchestrateurs multi-agents AI : Concevoir des flux de travail automatisés complexes à l'aide du langage naturel
Orchestrateurs multi-agents AI : Concevoir des flux de travail automatisés complexes à l'aide du langage naturel

Dernières informations de 2026 : Découvrez les meilleurs outils d’orchestration multi-agent basés sur l’intelligence artificielle pour concevoir des workflows automatisés complexes à l’aide du langage naturel. Notre sélection révèle des plateformes reconnues et puissantes, idéales pour une automation des tâches sans faille et une gestion intelligente des processus. Comparez les options gratuites et payantes en vous basant sur des données issues du monde réel. Optimisez vos performances grâce aux classements mis à jour chaque semaine par les experts de XIX.AI.

10 outils
xix.ai
Édition d'images Meilleurs logiciels d'optimisation du bruit par intelligence artificielle : éliminez les grains et les artefacts des photos prises la nuit dans des conditions de faible luminosité.
Meilleurs logiciels d'optimisation du bruit par intelligence artificielle : éliminez les grains et les artefacts des photos prises la nuit dans des conditions de faible luminosité.

Découvrez les meilleurs logiciels de réduction du bruit par intelligence artificielle en 2026 pour la photographie nocturne en faible luminosité. Notre liste sélectionnée compare les outils gratuits et payants, et inclut des tests pratiques ainsi que des classements mis à jour chaque semaine. Éliminez facilement les grains d'image et autres artefacts. Développez votre avantage grâce à l’intelligence artificielle sur XIX.AI.

10 outils
xix.ai
commentaires (1)
0/500
NicholasThomas
NicholasThomas 26 avril 2026 18:00:25 UTC+02:00

Just tried the demo and honestly blown away by how natural the lip-sync feels now! 😮 Always thought AI dubbing sounded a bit robotic, but this seems like a huge leap. Wonder if this will start being used in indie films or even gaming soon? The open-source move is pretty bold too—curious to see how other companies respond.

OR