Maison
Tongyi dévoile son premier modèle d'IA vocale de qualité cinématographique : une parole dotée d'intelligence émotionnelle

Après qu’AIGC a révolutionné la génération d’images et de textes, la dernière frontière du cinéma et de la télévision — le doublage — est désormais franchie par le Tongyi Lab d’Alibaba. Le 16 mars, le Tongyi Lab a officiellement lancé et mis en open source le premier grand modèle multimodal au monde dédié au doublage cinématographique dans des scénarios variés, Fun-CineForge.
Pendant des années, la synthèse vocale par IA a été marquée par des intonations « robotiques » et « de type présentateur ». Au cinéma et à la télévision, la capture de la profondeur émotionnelle, le mixage des sons ambiants et la synchronisation labiale restaient des obstacles majeurs. Fun-CineForge a été créé spécifiquement pour surmonter ces défis.
Ce modèle introduit une conception intégrée « données + modèle » révolutionnaire. Parallèlement au modèle, Tongyi Lab a fourni une méthode pour construire des ensembles de données de haute qualité. Cela permet à l’IA d’aller au-delà de la simple lecture de texte pour comprendre en profondeur des contextes cinématographiques complexes, en reproduisant des nuances émotionnelles subtiles et des effets audio spatiaux.
En tant que nouveau membre de la famille Alibaba Tongyi, Fun-CineForge , en open source, change la donne. Il offre aux créateurs de vidéos un outil de post-production de « qualité cinématographique » et, grâce à une technologie accessible, permet aux créateurs indépendants et aux productions à budget moyen de réaliser un doublage multilingue de haute qualité à un coût minimal.
Du précédent Qwen3-Omni à l'actuel Fun-CineForge , la série Tongyi est en passe de compléter rapidement le puzzle multimodal. À mesure que l'IA apprend à « se comporter comme un humain », l'ensemble du paysage de la traduction et de la post-production cinématographiques pourrait être redéfini. Le modèle et son plan de construction de l'ensemble de données sont désormais disponibles sur les principales plateformes open source, signe que l'ère de l'« IA de qualité cinématographique » arrive plus tôt que prévu.
Article connexe
La facturation basée sur des jetons de Github Copilot provoque la colère des développeurs
L'âge d'or de GitHub Copilot chez Microsoft semble prendre fin, en particulier pour les utilisateurs individuels. L'entreprise passe d'un modèle de tarification fixe à un système basé sur des jetons, ce qui pourrait augmenter considérablement les coû
Points clés du dossier de soumission à l’IPO de SpaceX : ambitions d’expansion dans les domaines de l’internet par satellite et de l’intelligence artificielle
Dans son prospectus S-1 déposé en prévision d’une introduction en bourse, SpaceX a révélé un certain nombre de performances commerciales impressionnantes qui mettent en évidence sa position de force dans les communications spatiales et l’intelligence
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.
Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitemen
Recommandations de sujets spéciaux liés
commentaires (0)

Après qu’AIGC a révolutionné la génération d’images et de textes, la dernière frontière du cinéma et de la télévision — le doublage — est désormais franchie par le Tongyi Lab d’Alibaba. Le 16 mars,
Pendant des années, la synthèse vocale par IA a été marquée par des intonations « robotiques » et « de type présentateur ». Au cinéma et à la télévision, la capture de la profondeur émotionnelle, le mixage des sons ambiants et la synchronisation labiale restaient des obstacles majeurs.
Ce modèle introduit une conception intégrée « données + modèle » révolutionnaire. Parallèlement au modèle,
En tant que nouveau membre de la famille Alibaba Tongyi,
Du précédent
La facturation basée sur des jetons de Github Copilot provoque la colère des développeurs
L'âge d'or de GitHub Copilot chez Microsoft semble prendre fin, en particulier pour les utilisateurs individuels. L'entreprise passe d'un modèle de tarification fixe à un système basé sur des jetons, ce qui pourrait augmenter considérablement les coû
Points clés du dossier de soumission à l’IPO de SpaceX : ambitions d’expansion dans les domaines de l’internet par satellite et de l’intelligence artificielle
Dans son prospectus S-1 déposé en prévision d’une introduction en bourse, SpaceX a révélé un certain nombre de performances commerciales impressionnantes qui mettent en évidence sa position de force dans les communications spatiales et l’intelligence
Alibaba Tuhao M890 fait ses débuts avec des performances triplées, marquant l’avènement d’une ère d’agents full-stack pour les modèles d’inference basés sur le cloud et les puces.
Le 20 mai 2026, lors du sommet Alibaba Cloud, la société a annoncé l’achèvement d’une mise à niveau complet de son système technologique, conçu pour l’ère des agents intelligents. Cette transformation a réorganisé l’ensemble de la chaîne de traitemen











