選項
首頁
快訊
內容
BruceSmith
BruceSmith
2026-03-24

阿里巴巴推出 PrismAudio,這是一個能為影片生成同步且高品質環境音效的全新視訊轉音訊框架。該框架已獲 ICLR 2026 錄用,採用「思維鏈」(Chain-of-Thought)分析流程及多教師評分系統。這款參數數為 5.18 億的輕量級模型,能在 0.63 秒內為一段 9 秒的影片生成音訊。

阿里巴巴推出 PrismAudio,這是一個能為影片生成同步且高品質環境音效的全新視訊轉音訊框架。該框架已獲 ICLR 2026 錄用,採用「思維鏈」(Chain-of-Thought)分析流程及多教師評分系統。這款參數數為 5.18 億的輕量級模型,能在 0.63 秒內為一段 9 秒的影片生成音訊。
評論 (0)
0/300
OR