Stability AI 推出智慧型手機相容的音訊世代模型

AI 創業公司 Stability AI 推出 Stable Audio Open Small,這是一款立體音訊生成模型,聲稱是目前速度最快、效率最高的產品,足以在智慧型手機上運作。
Stable Audio Open Small 是 Stability AI 與 Arm 合作的成果,Arm 是許多平板電腦、手機和其他行動裝置處理器背後的晶片製造商。雖然 Suno 和 Udio 等許多 AI 應用程式都能產生音訊,但大多數都依賴雲端處理,無法離線運作。
Stability 還表示,Stable Audio Open Small 的訓練資料集完全由 Free Music Archive 和 Freesound 資料庫中的免版稅曲目組成。這與 Suno 和 Udio 的訓練集形成強烈對比,據說這兩家公司的訓練集包含受版權保護的資料,會造成潛在的智慧財產權風險。
Stable Audio Open Small 擁有 3.41 億個參數,並針對 Arm CPU 進行最佳化,專門用於快速製作短小的音訊片段和音效,例如鼓型和樂器旋律。Stability AI 聲稱可在 8 秒內在智慧型手機上產生長達 11 秒的音訊。
聽聽這個使用 Stable Audio Open Small 製作的樣本:
以下是另一個範例:
此模型確實有其限制。Stable Audio Open Small 只接受英文提示,而且 Stability 在其文件中指出,它無法製作逼真的人聲或高保真歌曲。由於其訓練資料以西方音樂為中心,因此不同音樂類型的表現也不盡相同。
Techcrunch 活動參加 TechCrunch Sessions:人工智能
確保您能參加我們首屈一指的 AI 產業活動,講者來自 OpenAI、Anthropic 和 Cohere。在有限的時間內,參加一整天的專家講座、工作坊和寶貴的人際網絡,只需 $292 美元。
參加 TechCrunch Sessions:人工智能
預留您在 TechCrunch Sessions: AI 的展出空間:AI 並向超過 1,200 位決策者展示您的創新,而無需大量投資。截止至 5 月 9 日,售完即止。
加州柏克萊市 | 6月5日 立即註冊開發人員還應注意,Stable Audio Open Small 的使用條款有些限制。研究人員、業餘愛好者和年營收低於 100 萬美元的企業可免費使用,但年營收超過 100 萬美元的開發人員和組織必須購買 Stability 的企業授權。
Stability 是廣泛使用的影像產生模型 Stable Diffusion 背後的公司,去年從 Eric Schmidt 和 Napster 創辦人 Sean Parker 等投資人取得額外資金,以協助穩定業務。據報導,前執行長兼共同創辦人 Emad Mostaque 被指管理不善,導致財務困難、員工離職、與 Canva 合作失敗,以及投資人對公司未來的疑慮。
最近,Stability 已任命新的執行長,《鐵達尼號》導演 James Cameron 加入董事會,並發表了多種新的影像生成模型。
相關文章
Arm 推出首款自主設計晶片
在向 Nvidia 和 Apple 等公司授權其設計近 36 年後,這家歷史悠久的半導體與軟體公司 Arm Holdings 現正進軍自有晶片製造領域。在週二於舊金山舉行的活動中,該公司正式發表了 Arm AGI CPU,這是一款專為人工智慧資料中心推論工作負載設計、已具備量產能力的處理器。這款晶片採用 Arm 自家的 Neoverse 系列 CPU IP 核心開發,並與 Meta 合作打造,標誌
Arm為新創企業提供其邊緣人工智慧平台的彈性存取方案
Arm宣布,其最強大的邊緣人工智慧平台Armv9現已透過「彈性存取計畫」向新創公司開放。此計畫本質上是為晶片設計者提供的「試用後購買」模式,讓企業能以低成本或零成本(符合資格的新創公司適用)接觸廣泛的Arm技術、工具及資源組合。此舉使新創公司得以自由實驗與迭代設計,僅需為最終整合至產品中的技術支付授權費用。Arm表示,此模式已成為推動創新的重要催化劑。過去五年間,該計畫促成約400項成功晶片設計(
穩定性AI增強了手臂芯片的音頻模型
AI啟動穩定性AI已與芯片製造臂聯合起來,使穩定的音頻打開,這是一種能夠發電的音頻效果的AI型號,以使手臂芯片供電。儘管Suno和Udio等應用程序可以生成音頻,但它們通常取決於雲處理,
相關專題推薦
評論 (1)
0/500

AI 創業公司 Stability AI 推出 Stable Audio Open Small,這是一款立體音訊生成模型,聲稱是目前速度最快、效率最高的產品,足以在智慧型手機上運作。
Stable Audio Open Small 是 Stability AI 與 Arm 合作的成果,Arm 是許多平板電腦、手機和其他行動裝置處理器背後的晶片製造商。雖然 Suno 和 Udio 等許多 AI 應用程式都能產生音訊,但大多數都依賴雲端處理,無法離線運作。
Stability 還表示,Stable Audio Open Small 的訓練資料集完全由 Free Music Archive 和 Freesound 資料庫中的免版稅曲目組成。這與 Suno 和 Udio 的訓練集形成強烈對比,據說這兩家公司的訓練集包含受版權保護的資料,會造成潛在的智慧財產權風險。
Stable Audio Open Small 擁有 3.41 億個參數,並針對 Arm CPU 進行最佳化,專門用於快速製作短小的音訊片段和音效,例如鼓型和樂器旋律。Stability AI 聲稱可在 8 秒內在智慧型手機上產生長達 11 秒的音訊。
聽聽這個使用 Stable Audio Open Small 製作的樣本:
以下是另一個範例:
此模型確實有其限制。Stable Audio Open Small 只接受英文提示,而且 Stability 在其文件中指出,它無法製作逼真的人聲或高保真歌曲。由於其訓練資料以西方音樂為中心,因此不同音樂類型的表現也不盡相同。
Techcrunch 活動參加 TechCrunch Sessions:人工智能
確保您能參加我們首屈一指的 AI 產業活動,講者來自 OpenAI、Anthropic 和 Cohere。在有限的時間內,參加一整天的專家講座、工作坊和寶貴的人際網絡,只需 $292 美元。
參加 TechCrunch Sessions:人工智能
預留您在 TechCrunch Sessions: AI 的展出空間:AI 並向超過 1,200 位決策者展示您的創新,而無需大量投資。截止至 5 月 9 日,售完即止。
加州柏克萊市 | 6月5日 立即註冊開發人員還應注意,Stable Audio Open Small 的使用條款有些限制。研究人員、業餘愛好者和年營收低於 100 萬美元的企業可免費使用,但年營收超過 100 萬美元的開發人員和組織必須購買 Stability 的企業授權。
Stability 是廣泛使用的影像產生模型 Stable Diffusion 背後的公司,去年從 Eric Schmidt 和 Napster 創辦人 Sean Parker 等投資人取得額外資金,以協助穩定業務。據報導,前執行長兼共同創辦人 Emad Mostaque 被指管理不善,導致財務困難、員工離職、與 Canva 合作失敗,以及投資人對公司未來的疑慮。
最近,Stability 已任命新的執行長,《鐵達尼號》導演 James Cameron 加入董事會,並發表了多種新的影像生成模型。
Arm 推出首款自主設計晶片
在向 Nvidia 和 Apple 等公司授權其設計近 36 年後,這家歷史悠久的半導體與軟體公司 Arm Holdings 現正進軍自有晶片製造領域。在週二於舊金山舉行的活動中,該公司正式發表了 Arm AGI CPU,這是一款專為人工智慧資料中心推論工作負載設計、已具備量產能力的處理器。這款晶片採用 Arm 自家的 Neoverse 系列 CPU IP 核心開發,並與 Meta 合作打造,標誌
Arm為新創企業提供其邊緣人工智慧平台的彈性存取方案
Arm宣布,其最強大的邊緣人工智慧平台Armv9現已透過「彈性存取計畫」向新創公司開放。此計畫本質上是為晶片設計者提供的「試用後購買」模式,讓企業能以低成本或零成本(符合資格的新創公司適用)接觸廣泛的Arm技術、工具及資源組合。此舉使新創公司得以自由實驗與迭代設計,僅需為最終整合至產品中的技術支付授權費用。Arm表示,此模式已成為推動創新的重要催化劑。過去五年間,該計畫促成約400項成功晶片設計(
穩定性AI增強了手臂芯片的音頻模型
AI啟動穩定性AI已與芯片製造臂聯合起來,使穩定的音頻打開,這是一種能夠發電的音頻效果的AI型號,以使手臂芯片供電。儘管Suno和Udio等應用程序可以生成音頻,但它們通常取決於雲處理,





首頁






