Stability AI stellt ein Audiomodell vor, das sechsminütige Songs generieren kann
Stability AI, der Entwickler von Stable Diffusion, hat eine neue Serie von Audiomodellen namens Stability Audio 3.0 vorgestellt. Nach Angaben des Unternehmens ist das Flaggschiff-Modell in der Lage, Musikstücke in professioneller Qualität mit einer Länge von mehr als sechs Minuten zu erzeugen.
Unter dem Dach von Stability Audio 3.0 stellt das Unternehmen vier Modelle vor: small SFX (459 Millionen Parameter), small (459 Millionen Parameter), medium (1,4 Milliarden Parameter) und large (2,7 Milliarden Parameter). Die beiden kleinen Modelle sind für die geräteinterne Klang- und Musikgenerierung ausgelegt und haben eine maximale Ausgabelänge von zwei Minuten.
Die mittleren und großen Modelle können vollständige Kompositionen von bis zu 6 Minuten und 20 Sekunden erzeugen, wobei die musikalische Struktur und die melodische Kohärenz erhalten bleiben. Das ist mehr als doppelt so lang wie die mit Stable Audio 2.0, das 2024 auf den Markt kam, erreichbare Dauer.
Stability AI veröffentlicht die kleinen SFX-, kleinen und mittleren Modelle mit offenen Gewichten, sodass jeder sie nutzen und modifizieren kann. Im Jahr 2024 führte das Unternehmen Stable Audio Open ein, das die Musikgenerierung von bis zu 47 Sekunden ermöglichte. Diese neue Modellfamilie stellt einen bedeutenden Fortschritt gegenüber ihren Open-Source-Vorgängern dar.

Bildnachweis: StabilityAI
Das große Modell ist nur über die API und kostenpflichtige Self-Hosting-Dienste zugänglich. Darüber hinaus müssen Unternehmen mit einem Jahresumsatz von mehr als 1 Million US-Dollar eine Unternehmenslizenz erwerben.
Zahlreiche Unternehmen, darunter Google und ElevenLabs, bringen Modelle und Tools zur Musikgenerierung auf den Markt. Wie jedoch die anhaltenden Rechtsstreitigkeiten um Suno und Udio gezeigt haben, könnten Datenlizenzen und Partnerschaften mit Musiklabels für die langfristige Tragfähigkeit dieser Dienste entscheidend sein.
Im vergangenen Jahr unterzeichnete Stability AI Vereinbarungen mit der Warner Music Group und der Universal Music Group zur Entwicklung von Modellen und Tools zur Musikkomposition. Das Unternehmen gibt an, dass seine neuesten Audiomodelle auf vollständig lizenzierten Daten trainiert wurden.
Das KI-Startup entwickelt eine neue Produktreihe, die speziell auf professionelle Musiker zugeschnitten ist, hat jedoch noch keine konkreten Funktionen bekannt gegeben. Ethan Kaplan, ehemals Chief Digital Officer bei Universal Audio und Fender, tritt dem Unternehmen bei, um die professionelle Musikabteilung von Stability zu leiten.
Mehrere KI-Unternehmen stärken ihre Glaubwürdigkeit durch die Rekrutierung von Führungskräften aus der Musikbranche. Anfang dieses Jahres ernannte Suno den ehemaligen Merlin-CEO Jeremy Sirota zum Chief Commercial Officer. ElevenLabs holte zudem Derek Cournoyer vom Indie-Musikverlag Kobalt als Strategieleiter für sein Musikgeschäft an Bord.
Verwandter Artikel
Spotify preist KI als Schlüssel zur Stärkung seiner führenden Entwickler
Hat die KI-gesteuerte Entwicklung einen entscheidenden Meilenstein erreicht? Spotify deutet dies jedenfalls an. Bei der Bekanntgabe der Ergebnisse für das vierte Quartal in dieser Woche gab das Untern
Janet Jacksons "Rhythm Nation" brachte ausgewählte Windows-Laptops jahrelang zum Absturz
Langjährige Leser von The Verge erinnern sich vielleicht noch an den merkwürdigen Vorfall, bei dem Janet Jacksons Musikvideo "Rhythm Nation" bestimmte Windows-Laptops zum Absturz bringen konnte, indem
SoundCloud stellt klar, dass es keine KI auf Benutzermusik trainiert
Im Februar letzten Jahres überarbeitete die Musik-Sharing-Plattform SoundCloud diskret ihre Nutzungsbedingungen und führte neue Bestimmungen ein, die das Training von KI-Modellen mit nutzergeneriertem
Empfehlungen zu verwandten Spezialthemen
Kommentare (0)
Stability AI, der Entwickler von Stable Diffusion, hat eine neue Serie von Audiomodellen namens Stability Audio 3.0 vorgestellt. Nach Angaben des Unternehmens ist das Flaggschiff-Modell in der Lage, Musikstücke in professioneller Qualität mit einer Länge von mehr als sechs Minuten zu erzeugen.
Unter dem Dach von Stability Audio 3.0 stellt das Unternehmen vier Modelle vor: small SFX (459 Millionen Parameter), small (459 Millionen Parameter), medium (1,4 Milliarden Parameter) und large (2,7 Milliarden Parameter). Die beiden kleinen Modelle sind für die geräteinterne Klang- und Musikgenerierung ausgelegt und haben eine maximale Ausgabelänge von zwei Minuten.
Die mittleren und großen Modelle können vollständige Kompositionen von bis zu 6 Minuten und 20 Sekunden erzeugen, wobei die musikalische Struktur und die melodische Kohärenz erhalten bleiben. Das ist mehr als doppelt so lang wie die mit Stable Audio 2.0, das 2024 auf den Markt kam, erreichbare Dauer.
Stability AI veröffentlicht die kleinen SFX-, kleinen und mittleren Modelle mit offenen Gewichten, sodass jeder sie nutzen und modifizieren kann. Im Jahr 2024 führte das Unternehmen Stable Audio Open ein, das die Musikgenerierung von bis zu 47 Sekunden ermöglichte. Diese neue Modellfamilie stellt einen bedeutenden Fortschritt gegenüber ihren Open-Source-Vorgängern dar.

Bildnachweis: StabilityAI
Das große Modell ist nur über die API und kostenpflichtige Self-Hosting-Dienste zugänglich. Darüber hinaus müssen Unternehmen mit einem Jahresumsatz von mehr als 1 Million US-Dollar eine Unternehmenslizenz erwerben.
Zahlreiche Unternehmen, darunter Google und ElevenLabs, bringen Modelle und Tools zur Musikgenerierung auf den Markt. Wie jedoch die anhaltenden Rechtsstreitigkeiten um Suno und Udio gezeigt haben, könnten Datenlizenzen und Partnerschaften mit Musiklabels für die langfristige Tragfähigkeit dieser Dienste entscheidend sein.
Im vergangenen Jahr unterzeichnete Stability AI Vereinbarungen mit der Warner Music Group und der Universal Music Group zur Entwicklung von Modellen und Tools zur Musikkomposition. Das Unternehmen gibt an, dass seine neuesten Audiomodelle auf vollständig lizenzierten Daten trainiert wurden.
Das KI-Startup entwickelt eine neue Produktreihe, die speziell auf professionelle Musiker zugeschnitten ist, hat jedoch noch keine konkreten Funktionen bekannt gegeben. Ethan Kaplan, ehemals Chief Digital Officer bei Universal Audio und Fender, tritt dem Unternehmen bei, um die professionelle Musikabteilung von Stability zu leiten.
Mehrere KI-Unternehmen stärken ihre Glaubwürdigkeit durch die Rekrutierung von Führungskräften aus der Musikbranche. Anfang dieses Jahres ernannte Suno den ehemaligen Merlin-CEO Jeremy Sirota zum Chief Commercial Officer. ElevenLabs holte zudem Derek Cournoyer vom Indie-Musikverlag Kobalt als Strategieleiter für sein Musikgeschäft an Bord.
Spotify preist KI als Schlüssel zur Stärkung seiner führenden Entwickler
Hat die KI-gesteuerte Entwicklung einen entscheidenden Meilenstein erreicht? Spotify deutet dies jedenfalls an. Bei der Bekanntgabe der Ergebnisse für das vierte Quartal in dieser Woche gab das Untern
Janet Jacksons "Rhythm Nation" brachte ausgewählte Windows-Laptops jahrelang zum Absturz
Langjährige Leser von The Verge erinnern sich vielleicht noch an den merkwürdigen Vorfall, bei dem Janet Jacksons Musikvideo "Rhythm Nation" bestimmte Windows-Laptops zum Absturz bringen konnte, indem





Heim






