Stability AI 推出一款能够生成六分钟歌曲的音频模型
Stable Diffusion 的开发者 Stability AI 近日发布了一系列名为 Stability Audio 3.0 的新音频模型。据该公司介绍,其旗舰模型能够生成时长超过六分钟的专业级音乐作品。
在 Stability Audio 3.0 系列下,该公司推出了四款模型:小型 SFX(4.59 亿参数)、小型(4.59 亿参数)、中型(14 亿参数)和大型(27 亿参数)。其中两款小型模型专为设备端音效和音乐生成设计,最大输出时长为两分钟。
中型和大型模型可生成长达6分20秒的完整乐曲,并能保持音乐结构与旋律连贯性。这比2024年推出的Stable Audio 2.0所能实现的时长延长了一倍多。
Stability AI将以开放权重形式发布小型SFX、小型及中型模型,允许任何人使用和修改。2024年,该公司推出了Stable Audio Open,支持生成长达47秒的音乐。这一全新模型系列相较于其开源前代产品实现了重大飞跃。

图片来源:StabilityAI
大型模型仅可通过API及付费的自托管服务访问。此外,年收入超过100万美元的企业必须获取企业许可证。
包括谷歌和ElevenLabs在内的众多公司正陆续推出音乐生成模型和工具。然而,正如涉及Suno和Udio的持续法律纠纷所表明的,数据授权以及与音乐厂牌的合作关系,可能对这些服务的长期可行性至关重要。
去年,Stability AI 与华纳音乐集团(Warner Music Group)及环球音乐集团(Universal Music Group)签署协议,共同开发模型和音乐创作工具。该公司表示,其最新的音频模型是在完全获得授权的数据上进行训练的。
这家AI初创公司正在开发一套专为专业音乐人打造的新产品套件,尽管尚未披露具体功能。曾任环球音频(Universal Audio)和芬达(Fender)首席数字官的伊桑·卡普兰(Ethan Kaplan)已加入该公司,将领导Stability的专业音乐部门。
多家AI公司正通过招募音乐行业高管来提升自身公信力。今年早些时候,Suno任命前Merlin首席执行官杰里米·西罗塔(Jeremy Sirota)为首席商务官。ElevenLabs也从独立音乐出版商Kobalt挖来了德里克·科诺耶(Derek Cournoyer),担任其音乐业务的战略负责人。
相关文章
Spotify宣称人工智能是赋能其顶尖开发者的关键
人工智能驱动的开发是否已达到关键里程碑?Spotify无疑给出了肯定答案。在本周的第四季度财报电话会议上,该公司透露其顶尖工程师"自去年12月以来未编写过任何代码"。此言出自Spotify联合首席执行官古斯塔夫·索德斯特伦之口,他同时强调了公司如何借助人工智能加速产品开发。值得注意的是,Spotify在2025年全年为其流媒体应用推出了50多项新功能和更新。近期更接连推出多项AI驱动的创新功能,包
珍妮特-杰克逊的 "节奏民族 "导致部分 Windows 笔记本电脑崩溃多年
The Verge的长期读者可能还记得一个奇特的事件:珍妮特-杰克逊(Janet Jackson)的 "Rhythm Nation "音乐视频只要在附近播放,就会导致某些 Windows 笔记本电脑崩溃。现在,微软员工雷蒙德-陈(Raymond Chen)在PCWorld 的一篇博客文章中透露,为解决这一问题而设计的过滤器 "至少在 Windows 7 之前 "一直存在。对于新手来说:早在 202
SoundCloud 澄清不会对用户音乐进行人工智能训练
据TechCrunch 报道,去年 2 月,音乐共享平台 SoundCloud 谨慎地修改了其使用条款,引入了允许使用用户生成的材料训练人工智能模型的新规定。虽然该公司表示实际上还没有将用户内容用于模型训练,但它为将来的使用敞开了大门。SoundCloud 高级副总裁兼通信主管马尼-格林伯格(Marni Greenberg)通过电子邮件向The Verge 分享了以下声明:SoundCloud 从
相关专题推荐
评论 (0)
0/500
Stable Diffusion 的开发者 Stability AI 近日发布了一系列名为 Stability Audio 3.0 的新音频模型。据该公司介绍,其旗舰模型能够生成时长超过六分钟的专业级音乐作品。
在 Stability Audio 3.0 系列下,该公司推出了四款模型:小型 SFX(4.59 亿参数)、小型(4.59 亿参数)、中型(14 亿参数)和大型(27 亿参数)。其中两款小型模型专为设备端音效和音乐生成设计,最大输出时长为两分钟。
中型和大型模型可生成长达6分20秒的完整乐曲,并能保持音乐结构与旋律连贯性。这比2024年推出的Stable Audio 2.0所能实现的时长延长了一倍多。
Stability AI将以开放权重形式发布小型SFX、小型及中型模型,允许任何人使用和修改。2024年,该公司推出了Stable Audio Open,支持生成长达47秒的音乐。这一全新模型系列相较于其开源前代产品实现了重大飞跃。

图片来源:StabilityAI
大型模型仅可通过API及付费的自托管服务访问。此外,年收入超过100万美元的企业必须获取企业许可证。
包括谷歌和ElevenLabs在内的众多公司正陆续推出音乐生成模型和工具。然而,正如涉及Suno和Udio的持续法律纠纷所表明的,数据授权以及与音乐厂牌的合作关系,可能对这些服务的长期可行性至关重要。
去年,Stability AI 与华纳音乐集团(Warner Music Group)及环球音乐集团(Universal Music Group)签署协议,共同开发模型和音乐创作工具。该公司表示,其最新的音频模型是在完全获得授权的数据上进行训练的。
这家AI初创公司正在开发一套专为专业音乐人打造的新产品套件,尽管尚未披露具体功能。曾任环球音频(Universal Audio)和芬达(Fender)首席数字官的伊桑·卡普兰(Ethan Kaplan)已加入该公司,将领导Stability的专业音乐部门。
多家AI公司正通过招募音乐行业高管来提升自身公信力。今年早些时候,Suno任命前Merlin首席执行官杰里米·西罗塔(Jeremy Sirota)为首席商务官。ElevenLabs也从独立音乐出版商Kobalt挖来了德里克·科诺耶(Derek Cournoyer),担任其音乐业务的战略负责人。
Spotify宣称人工智能是赋能其顶尖开发者的关键
人工智能驱动的开发是否已达到关键里程碑?Spotify无疑给出了肯定答案。在本周的第四季度财报电话会议上,该公司透露其顶尖工程师"自去年12月以来未编写过任何代码"。此言出自Spotify联合首席执行官古斯塔夫·索德斯特伦之口,他同时强调了公司如何借助人工智能加速产品开发。值得注意的是,Spotify在2025年全年为其流媒体应用推出了50多项新功能和更新。近期更接连推出多项AI驱动的创新功能,包
珍妮特-杰克逊的 "节奏民族 "导致部分 Windows 笔记本电脑崩溃多年
The Verge的长期读者可能还记得一个奇特的事件:珍妮特-杰克逊(Janet Jackson)的 "Rhythm Nation "音乐视频只要在附近播放,就会导致某些 Windows 笔记本电脑崩溃。现在,微软员工雷蒙德-陈(Raymond Chen)在PCWorld 的一篇博客文章中透露,为解决这一问题而设计的过滤器 "至少在 Windows 7 之前 "一直存在。对于新手来说:早在 202





首页






