Stability AI 推出一款能生成六分鐘歌曲的音訊模型
Stable Diffusion 的開發商 Stability AI 近日推出了一系列名為 Stability Audio 3.0 的新音訊模型。據該公司表示,其旗艦模型能夠生成長度超過六分鐘的專業級音樂曲目。
在 Stability Audio 3.0 系列下,該公司推出了四款模型:小型 SFX(4.59 億參數)、小型(4.59 億參數)、中型(14 億參數)以及大型(27 億參數)。其中兩款小型模型專為裝置端音效與音樂生成設計,最大輸出長度為兩分鐘。
中型與大型模型則能生成長達 6 分 20 秒的完整樂曲,並能維持音樂結構與旋律連貫性。這比 2024 年推出的 Stable Audio 2.0 所能達成的長度多出兩倍以上。
Stability AI 將以開放權重形式釋出小型 SFX、小型及中型模型,讓任何人都能使用並修改它們。2024 年,該公司推出了 Stable Audio Open,可生成長達 47 秒的音樂。這套新模型系列相較於其開源前代產品,代表著顯著的進步。

圖片來源:StabilityAI圖片來源:Stability AI
大型模型僅可透過 API 及付費的自建伺服器服務存取。此外,年營收超過 100 萬美元的企業必須取得企業授權。
包括 Google 和 ElevenLabs 在內的眾多企業,正陸續推出音樂生成模型與工具。然而,正如 Suno 與 Udio 之間持續的法律糾紛所示,數據授權以及與音樂廠牌的合作夥伴關係,對於這些服務的長期可行性至關重要。
去年,Stability AI 已與華納音樂集團(Warner Music Group)及環球音樂集團(Universal Music Group)簽署協議,共同開發模型與音樂創作工具。該公司聲明,其最新的音訊模型均採用完全取得授權的數據進行訓練。
這家 AI 新創公司正開發一套專為專業音樂人量身打造的新產品組合,儘管尚未透露具體功能。曾任 Universal Audio 和 Fender 數位長(CDO)的 Ethan Kaplan 將加入該公司,領導 Stability 的專業音樂部門。
多家 AI 公司正透過招募音樂產業高管來提升其公信力。今年稍早,Suno 任命前 Merlin 執行長 Jeremy Sirota 為首席商務官。ElevenLabs 也從獨立音樂出版商 Kobalt 挖角 Derek Cournoyer,擔任其音樂業務的策略負責人。
相關文章
Spotify宣稱人工智慧是賦能頂尖開發者的關鍵
人工智慧驅動的開發是否已達關鍵里程碑?Spotify的表現確實如此。在本週第四季財報電話會議中,該公司透露其頂尖工程師「自去年十二月以來未寫過任何程式碼」。此發言出自Spotify共同執行長古斯塔夫·索德斯特倫之口,他同時強調公司如何運用人工智慧加速產品開發。值得注意的是,Spotify在2025年全年為其串流應用程式推出了超過50項新功能與更新。近期更接連推出多項AI驅動創新功能,包括「提示式播
Janet Jackson 的「Rhythm Nation」造成特定 Windows 筆記型電腦當機多年
The Verge的長期讀者可能還記得 Janet Jackson 的「Rhythm Nation」音樂影片在附近播放就會讓某些 Windows 筆記型電腦當機的奇特事件。現在,在PCWorld 特別報導的一篇部落格文章中,微軟員工 Raymond Chen 透露,為了解決這個問題而設計的過濾器,在「至少 Windows 7」之前一直存在。對於新手而言:早在 2022 年,Chen 撰寫了兩篇文章
SoundCloud 澄清不會對使用者音樂進行 AI 訓練
據TechCrunch 報導,去年二月,音樂分享平台 SoundCloud 謹慎地修改了其使用條款,引入了允許使用用戶產生的資料來訓練 AI 模型的新規定。儘管該公司表示尚未實際使用使用者內容來訓練模型,但仍為未來的使用敞開大門。SoundCloud 資深副總裁兼通訊主管 Marni Greenberg 透過電子郵件向The Verge 分享以下聲明:SoundCloud 從未使用藝人內容來訓練
相關專題推薦
評論 (0)
0/500
Stable Diffusion 的開發商 Stability AI 近日推出了一系列名為 Stability Audio 3.0 的新音訊模型。據該公司表示,其旗艦模型能夠生成長度超過六分鐘的專業級音樂曲目。
在 Stability Audio 3.0 系列下,該公司推出了四款模型:小型 SFX(4.59 億參數)、小型(4.59 億參數)、中型(14 億參數)以及大型(27 億參數)。其中兩款小型模型專為裝置端音效與音樂生成設計,最大輸出長度為兩分鐘。
中型與大型模型則能生成長達 6 分 20 秒的完整樂曲,並能維持音樂結構與旋律連貫性。這比 2024 年推出的 Stable Audio 2.0 所能達成的長度多出兩倍以上。
Stability AI 將以開放權重形式釋出小型 SFX、小型及中型模型,讓任何人都能使用並修改它們。2024 年,該公司推出了 Stable Audio Open,可生成長達 47 秒的音樂。這套新模型系列相較於其開源前代產品,代表著顯著的進步。

圖片來源:StabilityAI圖片來源:Stability AI
大型模型僅可透過 API 及付費的自建伺服器服務存取。此外,年營收超過 100 萬美元的企業必須取得企業授權。
包括 Google 和 ElevenLabs 在內的眾多企業,正陸續推出音樂生成模型與工具。然而,正如 Suno 與 Udio 之間持續的法律糾紛所示,數據授權以及與音樂廠牌的合作夥伴關係,對於這些服務的長期可行性至關重要。
去年,Stability AI 已與華納音樂集團(Warner Music Group)及環球音樂集團(Universal Music Group)簽署協議,共同開發模型與音樂創作工具。該公司聲明,其最新的音訊模型均採用完全取得授權的數據進行訓練。
這家 AI 新創公司正開發一套專為專業音樂人量身打造的新產品組合,儘管尚未透露具體功能。曾任 Universal Audio 和 Fender 數位長(CDO)的 Ethan Kaplan 將加入該公司,領導 Stability 的專業音樂部門。
多家 AI 公司正透過招募音樂產業高管來提升其公信力。今年稍早,Suno 任命前 Merlin 執行長 Jeremy Sirota 為首席商務官。ElevenLabs 也從獨立音樂出版商 Kobalt 挖角 Derek Cournoyer,擔任其音樂業務的策略負責人。
Spotify宣稱人工智慧是賦能頂尖開發者的關鍵
人工智慧驅動的開發是否已達關鍵里程碑?Spotify的表現確實如此。在本週第四季財報電話會議中,該公司透露其頂尖工程師「自去年十二月以來未寫過任何程式碼」。此發言出自Spotify共同執行長古斯塔夫·索德斯特倫之口,他同時強調公司如何運用人工智慧加速產品開發。值得注意的是,Spotify在2025年全年為其串流應用程式推出了超過50項新功能與更新。近期更接連推出多項AI驅動創新功能,包括「提示式播
Janet Jackson 的「Rhythm Nation」造成特定 Windows 筆記型電腦當機多年
The Verge的長期讀者可能還記得 Janet Jackson 的「Rhythm Nation」音樂影片在附近播放就會讓某些 Windows 筆記型電腦當機的奇特事件。現在,在PCWorld 特別報導的一篇部落格文章中,微軟員工 Raymond Chen 透露,為了解決這個問題而設計的過濾器,在「至少 Windows 7」之前一直存在。對於新手而言:早在 2022 年,Chen 撰寫了兩篇文章





首頁






