Option
Heim
Eilmeldung
Inhalt
BruceSmith
BruceSmith
24. März 2026

Alibaba stellt PrismAudio vor, ein neues Video-zu-Audio-Framework, das synchronisierte, hochwertige Umgebungsgeräusche für Videos generiert. Das von der ICLR 2026 akzeptierte System nutzt einen „Chain-of-Thought“-Prozess zur Analyse sowie ein Multi-Teacher-Bewertungssystem. Das schlanke Modell mit 518 Millionen Parametern kann in 0,63 Sekunden den Ton für ein 9-Sekunden-Video erzeugen.

Alibaba stellt PrismAudio vor, ein neues Video-zu-Audio-Framework, das synchronisierte, hochwertige Umgebungsgeräusche für Videos generiert. Das von der ICLR 2026 akzeptierte System nutzt einen „Chain-of-Thought“-Prozess zur Analyse sowie ein Multi-Teacher-Bewertungssystem. Das schlanke Modell mit 518 Millionen Parametern kann in 0,63 Sekunden den Ton für ein 9-Sekunden-Video erzeugen.
Kommentare (0)
0/300
OR