Maison
Stability AI dévoile un modèle audio capable de générer des morceaux de six minutes
Stability AI, le créateur de Stable Diffusion, a dévoilé une nouvelle série de modèles audio baptisée Stability Audio 3.0. Selon l'entreprise, le modèle phare est capable de produire des morceaux de musique de qualité professionnelle d'une durée supérieure à six minutes.
Sous la bannière Stability Audio 3.0, la société présente quatre modèles : small SFX (459 millions de paramètres), small (459 millions de paramètres), medium (1,4 milliard de paramètres) et large (2,7 milliards de paramètres). Les deux petits modèles sont conçus pour la génération de sons et de musique sur appareil, avec une durée maximale de sortie de deux minutes.
Les modèles moyen et grand peuvent produire des compositions complètes d'une durée maximale de 6 minutes et 20 secondes, tout en préservant la structure musicale et la cohérence mélodique. C'est plus du double de la durée atteignable par Stable Audio 2.0, lancé en 2024.
Stability AI publie les modèles SFX petit, petit et moyen avec des poids ouverts, permettant à quiconque de les utiliser et de les modifier. En 2024, la société a lancé Stable Audio Open, qui permettait de générer de la musique jusqu'à 47 secondes. Cette nouvelle famille de modèles représente une avancée significative par rapport à ses prédécesseurs open source.

Crédits image : StabilityAI
Le modèle « large » n'est accessible que via l'API et des services d'auto-hébergement payants. De plus, les entreprises dont le chiffre d'affaires annuel dépasse 1 million de dollars doivent obtenir une licence d'entreprise.
De nombreuses entreprises, telles que Google et ElevenLabs, lancent des modèles et des outils de génération musicale. Cependant, comme l’ont démontré les litiges juridiques en cours impliquant Suno et Udio, les licences de données et les partenariats avec les labels musicaux pourraient s’avérer cruciaux pour la viabilité à long terme de ces services.
L'année dernière, Stability AI a signé des accords avec Warner Music Group et Universal Music Group pour développer des modèles et des outils de création musicale. La société affirme que ses derniers modèles audio sont entraînés sur des données entièrement sous licence.
La start-up spécialisée dans l'IA développe une nouvelle gamme de produits destinés aux musiciens professionnels, bien qu'elle n'ait pas dévoilé de fonctionnalités spécifiques. Ethan Kaplan, ancien directeur numérique chez Universal Audio et Fender, rejoint l'entreprise pour diriger la division musicale professionnelle de Stability.
Plusieurs entreprises d'IA renforcent leur crédibilité en recrutant des cadres issus de l'industrie musicale. Plus tôt cette année, Suno a nommé Jeremy Sirota, ancien PDG de Merlin, au poste de directeur commercial. ElevenLabs a également recruté Derek Cournoyer, anciennement chez l'éditeur de musique indépendant Kobalt, en tant que responsable de la stratégie pour son activité musicale.
Article connexe
Spotify vante l'IA comme élément clé pour donner plus de moyens à ses développeurs de premier plan
Le développement basé sur l'IA a-t-il franchi une étape décisive ? Spotify semble le penser. Lors de la présentation de ses résultats financiers du quatrième trimestre cette semaine, l'entreprise a ré
La chanson "Rhythm Nation" de Janet Jackson a fait planter certains ordinateurs portables sous Windows pendant des années.
Les lecteurs de longue date de The Verge se souviennent peut-être de l'incident particulier au cours duquel le clip vidéo "Rhythm Nation" de Janet Jackson pouvait faire planter certains ordinateurs po
SoundCloud précise qu'il n'entraîne pas l'IA sur la musique des utilisateurs
En février de l'année dernière, la plateforme de partage de musique SoundCloud a discrètement révisé ses conditions d'utilisation, introduisant de nouvelles dispositions qui autorisent la formation de
Recommandations de sujets spéciaux liés
commentaires (0)
Stability AI, le créateur de Stable Diffusion, a dévoilé une nouvelle série de modèles audio baptisée Stability Audio 3.0. Selon l'entreprise, le modèle phare est capable de produire des morceaux de musique de qualité professionnelle d'une durée supérieure à six minutes.
Sous la bannière Stability Audio 3.0, la société présente quatre modèles : small SFX (459 millions de paramètres), small (459 millions de paramètres), medium (1,4 milliard de paramètres) et large (2,7 milliards de paramètres). Les deux petits modèles sont conçus pour la génération de sons et de musique sur appareil, avec une durée maximale de sortie de deux minutes.
Les modèles moyen et grand peuvent produire des compositions complètes d'une durée maximale de 6 minutes et 20 secondes, tout en préservant la structure musicale et la cohérence mélodique. C'est plus du double de la durée atteignable par Stable Audio 2.0, lancé en 2024.
Stability AI publie les modèles SFX petit, petit et moyen avec des poids ouverts, permettant à quiconque de les utiliser et de les modifier. En 2024, la société a lancé Stable Audio Open, qui permettait de générer de la musique jusqu'à 47 secondes. Cette nouvelle famille de modèles représente une avancée significative par rapport à ses prédécesseurs open source.

Crédits image : StabilityAI
Le modèle « large » n'est accessible que via l'API et des services d'auto-hébergement payants. De plus, les entreprises dont le chiffre d'affaires annuel dépasse 1 million de dollars doivent obtenir une licence d'entreprise.
De nombreuses entreprises, telles que Google et ElevenLabs, lancent des modèles et des outils de génération musicale. Cependant, comme l’ont démontré les litiges juridiques en cours impliquant Suno et Udio, les licences de données et les partenariats avec les labels musicaux pourraient s’avérer cruciaux pour la viabilité à long terme de ces services.
L'année dernière, Stability AI a signé des accords avec Warner Music Group et Universal Music Group pour développer des modèles et des outils de création musicale. La société affirme que ses derniers modèles audio sont entraînés sur des données entièrement sous licence.
La start-up spécialisée dans l'IA développe une nouvelle gamme de produits destinés aux musiciens professionnels, bien qu'elle n'ait pas dévoilé de fonctionnalités spécifiques. Ethan Kaplan, ancien directeur numérique chez Universal Audio et Fender, rejoint l'entreprise pour diriger la division musicale professionnelle de Stability.
Plusieurs entreprises d'IA renforcent leur crédibilité en recrutant des cadres issus de l'industrie musicale. Plus tôt cette année, Suno a nommé Jeremy Sirota, ancien PDG de Merlin, au poste de directeur commercial. ElevenLabs a également recruté Derek Cournoyer, anciennement chez l'éditeur de musique indépendant Kobalt, en tant que responsable de la stratégie pour son activité musicale.
Spotify vante l'IA comme élément clé pour donner plus de moyens à ses développeurs de premier plan
Le développement basé sur l'IA a-t-il franchi une étape décisive ? Spotify semble le penser. Lors de la présentation de ses résultats financiers du quatrième trimestre cette semaine, l'entreprise a ré
La chanson "Rhythm Nation" de Janet Jackson a fait planter certains ordinateurs portables sous Windows pendant des années.
Les lecteurs de longue date de The Verge se souviennent peut-être de l'incident particulier au cours duquel le clip vidéo "Rhythm Nation" de Janet Jackson pouvait faire planter certains ordinateurs po











