Hogar
Tongyi presenta el primer modelo de IA de voz con calidad cinematográfica: se logra un discurso con inteligencia emocional

Después de que la AIGC revolucionara la generación de imágenes y texto, Tongyi Lab, de Alibaba, está abriendo ahora la última frontera en el mundo del cine y la televisión: la interpretación de voces. El 16 de marzo, Tongyi Lab presentó oficialmente y puso a disposición como código abierto el primer gran modelo multimodal del mundo para la interpretación de voces cinematográfica en múltiples escenarios: Fun-CineForge.
Durante años, la síntesis de voz mediante IA se ha visto lastrada por tonos «robóticos» y «tipo locutor». En el cine y la televisión, captar la profundidad emocional, la mezcla de sonido ambiental y la sincronización labial seguían siendo obstáculos importantes. Fun-CineForge se creó específicamente para superar estos retos.
Este modelo introduce un diseño integrado «datos + modelo» revolucionario. Junto con el modelo, Tongyi Lab proporcionó un método para construir conjuntos de datos de alta calidad. Esto permite a la IA ir más allá de la mera lectura de texto para comprender en profundidad contextos cinematográficos complejos, replicando sutiles matices emocionales y efectos de audio espacial.
Como nuevo miembro de la familia Alibaba Tongyi, el Fun-CineForge de código abierto supone un cambio revolucionario. Ofrece a los creadores de vídeo una herramienta de posproducción «de calidad cinematográfica» y, gracias a una tecnología accesible, permite a los creadores independientes y a las producciones de presupuesto medio lograr un doblaje multilingüe de alta calidad a un coste mínimo.
Desde el anterior Qwen3-Omni hasta el actual Fun-CineForge , la serie Tongyi está completando rápidamente el rompecabezas multimodal. A medida que la IA aprende a «actuar como un humano», todo el panorama de la traducción y la posproducción cinematográfica podría verse transformado. El modelo y su plan de construcción de conjuntos de datos ya están disponibles en las principales plataformas de código abierto, lo que indica que la era de la «IA de calidad cinematográfica» está llegando antes de lo previsto.
Artículo relacionado
Apple retira la aplicación Cal AI debido a compras dentro de la aplicación no autorizadas y facturación engañosa.
La reciente eliminación por parte de Apple de Cal AI, una popular aplicación de seguimiento alimentario basada en inteligencia artificial y disponible dentro de MyFitnessPal, pone de manifiesto su estricta aplicación de las políticas de la App Store
El sistema de facturación basado en tokens de Github Copilot provoca la indignación de los desarrolladores.
La era de oro de GitHub Copilot de Microsoft podría estar llegando a su fin, especialmente para los usuarios individuales. La empresa está pasando de un modelo de suscripción fija a uno basado en tokens, lo que podría aumentar significativamente los
Aspectos destacados del documento de oferta pública inicial de SpaceX: las ambiciones de expansión en internet por satélite y inteligencia artificial
En su declaración de registro S-1 presentada antes de lo que se espera sea su oferta pública inicial, SpaceX reveló recientemente una serie de impresionantes indicadores comerciales que destacan su sólida posición en las comunicaciones aeroespaciales
Recomendaciones de temas especiales relacionados
comentario (0)
0/500

Después de que la AIGC revolucionara la generación de imágenes y texto, Tongyi Lab, de Alibaba, está abriendo ahora la última frontera en el mundo del cine y la televisión: la interpretación de voces. El 16 de marzo,
Durante años, la síntesis de voz mediante IA se ha visto lastrada por tonos «robóticos» y «tipo locutor». En el cine y la televisión, captar la profundidad emocional, la mezcla de sonido ambiental y la sincronización labial seguían siendo obstáculos importantes.
Este modelo introduce un diseño integrado «datos + modelo» revolucionario. Junto con el modelo,
Como nuevo miembro de la familia Alibaba Tongyi, el
Desde el anterior
Apple retira la aplicación Cal AI debido a compras dentro de la aplicación no autorizadas y facturación engañosa.
La reciente eliminación por parte de Apple de Cal AI, una popular aplicación de seguimiento alimentario basada en inteligencia artificial y disponible dentro de MyFitnessPal, pone de manifiesto su estricta aplicación de las políticas de la App Store
El sistema de facturación basado en tokens de Github Copilot provoca la indignación de los desarrolladores.
La era de oro de GitHub Copilot de Microsoft podría estar llegando a su fin, especialmente para los usuarios individuales. La empresa está pasando de un modelo de suscripción fija a uno basado en tokens, lo que podría aumentar significativamente los
Aspectos destacados del documento de oferta pública inicial de SpaceX: las ambiciones de expansión en internet por satélite y inteligencia artificial
En su declaración de registro S-1 presentada antes de lo que se espera sea su oferta pública inicial, SpaceX reveló recientemente una serie de impresionantes indicadores comerciales que destacan su sólida posición en las comunicaciones aeroespaciales











