opção
BruceSmith
BruceSmith
24 de Março de 2026

A Alibaba lança o PrismAudio, uma nova estrutura de conversão de vídeo em áudio que gera som ambiente sincronizado e de alta qualidade para vídeos. Aceito pela ICLR 2026, o sistema utiliza um processo de cadeia de pensamento para análise e um sistema de pontuação com múltiplos professores. O modelo leve, com 518 milhões de parâmetros, é capaz de produzir o áudio para um vídeo de 9 segundos em 0,63 segundos.

A Alibaba lança o PrismAudio, uma nova estrutura de conversão de vídeo em áudio que gera som ambiente sincronizado e de alta qualidade para vídeos. Aceito pela ICLR 2026, o sistema utiliza um processo de cadeia de pensamento para análise e um sistema de pontuação com múltiplos professores. O modelo leve, com 518 milhões de parâmetros, é capaz de produzir o áudio para um vídeo de 9 segundos em 0,63 segundos.
Comentários (0)
0/300
OR