选项
首页
快讯
内容
BruceSmith
BruceSmith
2026-03-24

阿里巴巴发布了PrismAudio,这是一个全新的视频转音频框架,能够为视频生成同步且高质量的环境音效。该框架已被ICLR 2026录用,采用“思维链”分析流程和多教师评分系统。这个拥有5.18亿参数的轻量级模型,仅需0.63秒即可为一段9秒的视频生成音频。

阿里巴巴发布了PrismAudio,这是一个全新的视频转音频框架,能够为视频生成同步且高质量的环境音效。该框架已被ICLR 2026录用,采用“思维链”分析流程和多教师评分系统。这个拥有5.18亿参数的轻量级模型,仅需0.63秒即可为一段9秒的视频生成音频。
评论 (0)
0/300
OR