Maison
Aliyun, la branche cloud d'Alibaba, dévoile Fun-CineForge : un modèle et un ensemble de données de doublage de qualité cinématographique mis en open source
Le projet Fun-CineForge, développé par l'équipe spécialisée dans le traitement de la parole du laboratoire Alibaba Tongyi en collaboration avec l'Université des sciences et technologies de Chine, a récemment été officiellement mis en open source. Cette initiative s'attaque aux principaux défis du doublage cinématographique et télévisuel — tels que la synchronisation labiale, le transfert de style vocal et l'expression émotionnelle — en proposant un flux de production complet de bout en bout et des solutions basées sur des modèles à grande échelle.

Progrès majeurs : résoudre le problème du « décalage » dans le doublage cinématographique
Le doublage traditionnel par IA est souvent confronté à des problèmes tels que le décalage des mouvements des lèvres, une interprétation émotionnelle robotique et la difficulté à s'adapter à des scènes cinématographiques complexes impliquant des dialogues et des interactions acoustiques entre plusieurs personnes. Fun-CineForge réalise une avancée significative grâce à deux innovations clés :
Modèle de doublage MLLM: allant au-delà du simple alignement audio-vidéo au niveau des lèvres, il utilise une architecture de modèle linguistique multimodal à grande échelle (MLLM) capable de comprendre en profondeur l’identité d’un personnage et les nuances émotionnelles au sein d’une scène.
Ensemble de données à grande échelle CineDub: le projet a créé le premier ensemble de données de doublage de séries télévisées chinoises richement annoté via un pipeline automatisé, couvrant divers scénarios tels que les monologues, la narration, les dialogues et les interactions entre plusieurs locuteurs.
Mises à jour du projet et feuille de route open source
Le projet a récemment fait l'objet de mises à jour fréquentes, ce qui témoigne d'un haut niveau de maturité technique :
Janvier à mars 2026: publication d'exemples de jeux de données et de démonstrations pour le chinois (CineDub-CN) et l'anglais (CineDub-EN).
16 mars 2026 : mise en open source officielle du code d'inférence et des poids du modèle (points de contrôle), permettant aux développeurs d'accéder à ces ressources sur GitHub.
Accès aux ensembles de données: plusieurs ensembles de données de séries classiques sont désormais disponibles à des fins de recherche, notamment la série chinoise « Le Rêve dans le pavillon rouge » et la série anglaise « Downton Abbey ».
Application technique : du « dialogue » à la « performance »
Les démonstrations officielles montrent que le modèle produit des résultats impressionnants dans la refonte de séries classiques telles que « Romance of the Three Kingdoms ». En intégrant des « indices émotionnels » spécifiques, le modèle peut capturer avec précision les changements émotionnels d’un personnage — de la peur à la défiance —, permettant ainsi un clonage vocal haute fidélité et une synchronisation labiale naturelle.
Le lancement de Fun-CineForge marque un tournant dans le doublage cinématographique et télévisuel par IA, passant d’un simple « texte-voix » à un outil de « post-production automatisée » doté d’une compréhension artistique. Cette avancée devrait réduire considérablement les coûts de production des contenus cinématographiques et télévisuels doublés.
Projet : https://funcineforge.github.io/
Article connexe
OpenAI s’allie avec le Département de la Défense des États-Unis ; les installations de ChatGPT augmentent de 295 %.
Indignation du public : La collaboration militaire d’OpenAI déclenche une vague de désinstallationsRécemment, le leader de l’intelligence artificielle OpenAI a annoncé un partenariat étroit avec le Département de la Défense des États-Unis, intégrant
OpenAI lance la fonctionnalité « Sites », marquant la fin de l'ère du « no-code » avec des sites web créés à partir de texte
OpenAI a lancé « Sites », une nouvelle fonctionnalité pour Codex, son outil d'IA dédié à l'ingénierie logicielle. Actuellement en phase de préversion, elle n'est accessible qu'aux abonnés payants des
OpenAI rachète Hiro, une start-up spécialisée dans la gestion financière personnelle basée sur l'IA
OpenAI a racheté la start-up spécialisée dans la gestion des finances personnelles Hiro Finance, a annoncé lundi son fondateur Ethan Bloch, OpenAI ayant confirmé cette transaction à TechCrunch. La sta
Recommandations de sujets spéciaux liés
commentaires (0)
Le projet Fun-CineForge, développé par l'équipe spécialisée dans le traitement de la parole du laboratoire Alibaba Tongyi en collaboration avec l'Université des sciences et technologies de Chine, a récemment été officiellement mis en open source. Cette initiative s'attaque aux principaux défis du doublage cinématographique et télévisuel — tels que la synchronisation labiale, le transfert de style vocal et l'expression émotionnelle — en proposant un flux de production complet de bout en bout et des solutions basées sur des modèles à grande échelle.

Progrès majeurs : résoudre le problème du « décalage » dans le doublage cinématographique
Le doublage traditionnel par IA est souvent confronté à des problèmes tels que le décalage des mouvements des lèvres, une interprétation émotionnelle robotique et la difficulté à s'adapter à des scènes cinématographiques complexes impliquant des dialogues et des interactions acoustiques entre plusieurs personnes. Fun-CineForge réalise une avancée significative grâce à deux innovations clés :
Modèle de doublage MLLM: allant au-delà du simple alignement audio-vidéo au niveau des lèvres, il utilise une architecture de modèle linguistique multimodal à grande échelle (MLLM) capable de comprendre en profondeur l’identité d’un personnage et les nuances émotionnelles au sein d’une scène.
Ensemble de données à grande échelle CineDub: le projet a créé le premier ensemble de données de doublage de séries télévisées chinoises richement annoté via un pipeline automatisé, couvrant divers scénarios tels que les monologues, la narration, les dialogues et les interactions entre plusieurs locuteurs.
Mises à jour du projet et feuille de route open source
Le projet a récemment fait l'objet de mises à jour fréquentes, ce qui témoigne d'un haut niveau de maturité technique :
Janvier à mars 2026: publication d'exemples de jeux de données et de démonstrations pour le chinois (CineDub-CN) et l'anglais (CineDub-EN).
16 mars 2026 : mise en open source officielle du code d'inférence et des poids du modèle (points de contrôle), permettant aux développeurs d'accéder à ces ressources sur GitHub.
Accès aux ensembles de données: plusieurs ensembles de données de séries classiques sont désormais disponibles à des fins de recherche, notamment la série chinoise « Le Rêve dans le pavillon rouge » et la série anglaise « Downton Abbey ».
Application technique : du « dialogue » à la « performance »
Les démonstrations officielles montrent que le modèle produit des résultats impressionnants dans la refonte de séries classiques telles que « Romance of the Three Kingdoms ». En intégrant des « indices émotionnels » spécifiques, le modèle peut capturer avec précision les changements émotionnels d’un personnage — de la peur à la défiance —, permettant ainsi un clonage vocal haute fidélité et une synchronisation labiale naturelle.
Le lancement de Fun-CineForge marque un tournant dans le doublage cinématographique et télévisuel par IA, passant d’un simple « texte-voix » à un outil de « post-production automatisée » doté d’une compréhension artistique. Cette avancée devrait réduire considérablement les coûts de production des contenus cinématographiques et télévisuels doublés.
Projet : https://funcineforge.github.io/
OpenAI s’allie avec le Département de la Défense des États-Unis ; les installations de ChatGPT augmentent de 295 %.
Indignation du public : La collaboration militaire d’OpenAI déclenche une vague de désinstallationsRécemment, le leader de l’intelligence artificielle OpenAI a annoncé un partenariat étroit avec le Département de la Défense des États-Unis, intégrant
OpenAI lance la fonctionnalité « Sites », marquant la fin de l'ère du « no-code » avec des sites web créés à partir de texte
OpenAI a lancé « Sites », une nouvelle fonctionnalité pour Codex, son outil d'IA dédié à l'ingénierie logicielle. Actuellement en phase de préversion, elle n'est accessible qu'aux abonnés payants des
OpenAI rachète Hiro, une start-up spécialisée dans la gestion financière personnelle basée sur l'IA
OpenAI a racheté la start-up spécialisée dans la gestion des finances personnelles Hiro Finance, a annoncé lundi son fondateur Ethan Bloch, OpenAI ayant confirmé cette transaction à TechCrunch. La sta











