option
Maison
Flash info
Contenu
BruceSmith
BruceSmith
24 mars 2026

Alibaba lance PrismAudio, un nouveau framework vidéo-audio capable de générer des sons d'ambiance synchronisés et de haute qualité pour les vidéos. Accepté à l'ICLR 2026, il utilise un processus de « chaîne de pensée » pour l'analyse et un système de notation multi-enseignants. Ce modèle léger, doté de 518 millions de paramètres, peut produire la bande-son d'une vidéo de 9 secondes en 0,63 seconde.

Alibaba lance PrismAudio, un nouveau framework vidéo-audio capable de générer des sons d'ambiance synchronisés et de haute qualité pour les vidéos. Accepté à l'ICLR 2026, il utilise un processus de « chaîne de pensée » pour l'analyse et un système de notation multi-enseignants. Ce modèle léger, doté de 518 millions de paramètres, peut produire la bande-son d'une vidéo de 9 secondes en 0,63 seconde.
commentaires (0)
0/300
OR