Stability AI 推出与智能手机兼容的音频生成模型

人工智能初创公司 Stability AI 推出了一款立体声音频生成模型 Stable Audio Open Small,该模型号称是目前速度最快、效率最高的立体声音频生成模型,足以在智能手机上运行。
Stable Audio Open Small是Stability AI与Arm公司合作的成果,后者是平板电脑、手机和其他移动设备中许多处理器背后的芯片制造商。虽然 Suno 和 Udio 等众多人工智能应用程序都能生成音频,但它们大多依赖于云处理,无法离线运行。
Stability 还表示,Stable Audio Open Small 的训练数据集完全由自由音乐档案馆(Free Music Archive)和自由声音库(Freesound)中的免版税曲目组成。这与 Suno 和 Udio 的训练集形成了鲜明对比,据说这两个公司的训练集包含受版权保护的材料,会带来潜在的知识产权风险。
Stable Audio Open Small 拥有 3.41 亿个参数,并针对 Arm CPU 进行了优化,专为快速创建短音频片段和声音效果(如鼓点模式和乐器旋律)而设计。Stability AI 声称,它能在 8 秒内在智能手机上生成长达 11 秒的音频。
听听用 Stable Audio Open Small 制作的样本:
下面是另一个例子:
该模型确实存在局限性。Stable Audio Open Small 只接受英语提示,而且 Stability 在其文档中指出,它不能生成逼真的人声或高保真歌曲。由于其训练数据以西方音乐为中心,因此在不同音乐类型中的表现也不尽相同。
TechCrunch 活动参加 TechCrunch 会议:人工智能
确保您能参加我们最重要的人工智能行业活动,来自 OpenAI、Anthropic 和 Cohere 的演讲者将为您带来精彩演讲。在有限的时间内,参加一整天的专家讲座、研讨会和宝贵的交流活动只需 292 美元。
在 TechCrunch 会议上参展:人工智能
预订您在 TechCrunch Sessions: AI 上的展位:向 1200 多位决策者展示您的创新成果,无需大量投资。截止至 5 月 9 日,售完即止。
加利福尼亚州伯克利 6 月 5 日 现在注册开发人员还应注意,Stable Audio Open Small 附带了一些限制性使用条款。研究人员、业余爱好者和年收入低于 100 万美元的企业可以免费使用,但年收入超过 100 万美元的开发人员和组织必须购买 Stability 的企业许可证。
Stability 公司是广泛使用的图像生成模型 Stable Diffusion 的幕后公司,去年获得了包括埃里克-施密特(Eric Schmidt)和 Napster 创始人肖恩-帕克(Sean Parker)在内的投资者的追加资金,以帮助稳定业务。据报道,前首席执行官兼联合创始人埃马德-莫斯塔克(Emad Mostaque)涉嫌管理不善,导致公司陷入财务困境、员工离职、与 Canva 的合作失败,以及投资者对公司未来的担忧。
最近,Stability 公司任命了新的首席执行官,《泰坦尼克号》导演詹姆斯-卡梅隆(James Cameron)加入董事会,并发布了多个新的图像生成模型。
相关文章
Arm 推出首款自主研发芯片
在向英伟达和苹果等公司授权其设计近36年后,这家历史悠久的半导体和软件公司Arm Holdings如今正进军自主芯片制造领域。在周二于旧金山举办的一场活动中,该公司推出了Arm AGI CPU——一款专为AI数据中心推理工作负载设计的量产级处理器。该芯片基于Arm自主研发的Neoverse系列CPU IP内核,并与Meta合作开发,标志着Arm迈向了一个重要的全新方向。Meta将成为Arm AGI
Arm为初创企业提供灵活接入其边缘AI平台的途径
Arm宣布,其最强大的边缘AI平台Armv9现已通过灵活访问计划向初创企业开放。该计划本质上是面向芯片设计师的"先试后买"模式,为企业提供低成本或零成本(符合资格的初创企业)获取Arm技术、工具及资源的渠道。这使企业能够自由进行设计实验与迭代,仅需为最终投入量产的产品所采用的技术支付许可费。据Arm透露,该模式已显著催化创新进程。过去五年间,该计划促成约400项成功芯片设计(即流片项目)。树莓派、
稳定性AI增强了手臂芯片的音频模型
AI启动稳定性AI已与芯片制造臂联合起来,使稳定的音频打开,这是一种能够发电的音频效果的AI型号,以使手臂芯片供电。尽管Suno和Udio等应用程序可以生成音频,但它们通常取决于云处理,
相关专题推荐
评论 (1)
0/500

人工智能初创公司 Stability AI 推出了一款立体声音频生成模型 Stable Audio Open Small,该模型号称是目前速度最快、效率最高的立体声音频生成模型,足以在智能手机上运行。
Stable Audio Open Small是Stability AI与Arm公司合作的成果,后者是平板电脑、手机和其他移动设备中许多处理器背后的芯片制造商。虽然 Suno 和 Udio 等众多人工智能应用程序都能生成音频,但它们大多依赖于云处理,无法离线运行。
Stability 还表示,Stable Audio Open Small 的训练数据集完全由自由音乐档案馆(Free Music Archive)和自由声音库(Freesound)中的免版税曲目组成。这与 Suno 和 Udio 的训练集形成了鲜明对比,据说这两个公司的训练集包含受版权保护的材料,会带来潜在的知识产权风险。
Stable Audio Open Small 拥有 3.41 亿个参数,并针对 Arm CPU 进行了优化,专为快速创建短音频片段和声音效果(如鼓点模式和乐器旋律)而设计。Stability AI 声称,它能在 8 秒内在智能手机上生成长达 11 秒的音频。
听听用 Stable Audio Open Small 制作的样本:
下面是另一个例子:
该模型确实存在局限性。Stable Audio Open Small 只接受英语提示,而且 Stability 在其文档中指出,它不能生成逼真的人声或高保真歌曲。由于其训练数据以西方音乐为中心,因此在不同音乐类型中的表现也不尽相同。
TechCrunch 活动参加 TechCrunch 会议:人工智能
确保您能参加我们最重要的人工智能行业活动,来自 OpenAI、Anthropic 和 Cohere 的演讲者将为您带来精彩演讲。在有限的时间内,参加一整天的专家讲座、研讨会和宝贵的交流活动只需 292 美元。
在 TechCrunch 会议上参展:人工智能
预订您在 TechCrunch Sessions: AI 上的展位:向 1200 多位决策者展示您的创新成果,无需大量投资。截止至 5 月 9 日,售完即止。
加利福尼亚州伯克利 6 月 5 日 现在注册开发人员还应注意,Stable Audio Open Small 附带了一些限制性使用条款。研究人员、业余爱好者和年收入低于 100 万美元的企业可以免费使用,但年收入超过 100 万美元的开发人员和组织必须购买 Stability 的企业许可证。
Stability 公司是广泛使用的图像生成模型 Stable Diffusion 的幕后公司,去年获得了包括埃里克-施密特(Eric Schmidt)和 Napster 创始人肖恩-帕克(Sean Parker)在内的投资者的追加资金,以帮助稳定业务。据报道,前首席执行官兼联合创始人埃马德-莫斯塔克(Emad Mostaque)涉嫌管理不善,导致公司陷入财务困境、员工离职、与 Canva 的合作失败,以及投资者对公司未来的担忧。
最近,Stability 公司任命了新的首席执行官,《泰坦尼克号》导演詹姆斯-卡梅隆(James Cameron)加入董事会,并发布了多个新的图像生成模型。
Arm 推出首款自主研发芯片
在向英伟达和苹果等公司授权其设计近36年后,这家历史悠久的半导体和软件公司Arm Holdings如今正进军自主芯片制造领域。在周二于旧金山举办的一场活动中,该公司推出了Arm AGI CPU——一款专为AI数据中心推理工作负载设计的量产级处理器。该芯片基于Arm自主研发的Neoverse系列CPU IP内核,并与Meta合作开发,标志着Arm迈向了一个重要的全新方向。Meta将成为Arm AGI
Arm为初创企业提供灵活接入其边缘AI平台的途径
Arm宣布,其最强大的边缘AI平台Armv9现已通过灵活访问计划向初创企业开放。该计划本质上是面向芯片设计师的"先试后买"模式,为企业提供低成本或零成本(符合资格的初创企业)获取Arm技术、工具及资源的渠道。这使企业能够自由进行设计实验与迭代,仅需为最终投入量产的产品所采用的技术支付许可费。据Arm透露,该模式已显著催化创新进程。过去五年间,该计划促成约400项成功芯片设计(即流片项目)。树莓派、
稳定性AI增强了手臂芯片的音频模型
AI启动稳定性AI已与芯片制造臂联合起来,使稳定的音频打开,这是一种能够发电的音频效果的AI型号,以使手臂芯片供电。尽管Suno和Udio等应用程序可以生成音频,但它们通常取决于云处理,





首页






