Stability AI presenta un modelo de audio capaz de generar canciones de seis minutos
Stability AI, la empresa creadora de Stable Diffusion, ha presentado una nueva serie de modelos de audio denominada Stability Audio 3.0. Según la empresa, el modelo insignia es capaz de producir piezas musicales de calidad profesional con una duración superior a los seis minutos.
Bajo el paraguas de Stability Audio 3.0, la empresa presenta cuatro modelos: pequeño SFX (459 millones de parámetros), pequeño (459 millones de parámetros), mediano (1.400 millones de parámetros) y grande (2.700 millones de parámetros). Los dos modelos pequeños están diseñados para la generación de sonido y música en el propio dispositivo, con una duración máxima de salida de dos minutos.
Los modelos mediano y grande pueden producir composiciones completas de hasta 6 minutos y 20 segundos, conservando la estructura musical y la coherencia melódica. Eso es más del doble de la duración que se podía alcanzar con Stable Audio 2.0, lanzado en 2024.
Stability AI lanza los modelos SFX pequeño, pequeño y mediano con pesos abiertos, lo que permite a cualquiera utilizarlos y modificarlos. En 2024, la empresa presentó Stable Audio Open, que permitía la generación de música de hasta 47 segundos. Esta nueva familia de modelos supone un avance significativo con respecto a sus predecesores de código abierto.

Créditos de la imagen: StabilityAI
El modelo grande solo es accesible a través de la API y de servicios de autoalojamiento de pago. Además, las empresas con ingresos anuales superiores a 1 millón de dólares deben obtener una licencia empresarial.
Numerosas empresas, como Google y ElevenLabs, están lanzando modelos y herramientas para la generación de música. Sin embargo, como han demostrado las disputas legales en curso que involucran a Suno y Udio, las licencias de datos y las asociaciones con sellos discográficos pueden ser cruciales para la viabilidad a largo plazo de estos servicios.
El año pasado, Stability AI firmó acuerdos con Warner Music Group y Universal Music Group para desarrollar modelos y herramientas de creación musical. La empresa afirma que sus últimos modelos de audio se entrenan con datos con licencia completa.
La startup de IA está desarrollando una nueva suite de productos diseñada para músicos profesionales, aunque no ha revelado características específicas. Ethan Kaplan, anteriormente director digital de Universal Audio y Fender, se une a la empresa para dirigir la división de música profesional de Stability.
Varias empresas de IA están reforzando su credibilidad contratando a ejecutivos de la industria musical. A principios de este año, Suno nombró al antiguo director ejecutivo de Merlin, Jeremy Sirota, director comercial. ElevenLabs también incorporó a Derek Cournoyer, procedente de la editorial musical independiente Kobalt, como responsable de estrategia para su negocio musical.
Artículo relacionado
Spotify promociona la IA como clave para potenciar a sus desarrolladores líderes
¿Ha alcanzado el desarrollo impulsado por la IA un hito crítico? Spotify sin duda así lo sugiere. Durante su presentación de resultados del cuarto trimestre esta semana, la empresa reveló que sus mejo
La canción "Rhythm Nation" de Janet Jackson hizo que algunos portátiles con Windows se bloquearan durante años.
Los lectores veteranos de The Verge recordarán el peculiar incidente en el que el vídeo musical "Rhythm Nation" de Janet Jackson podía bloquear ciertos portátiles con Windows simplemente con reproduci
SoundCloud aclara que no entrena a la IA con la música de los usuarios
En febrero del año pasado, la plataforma de intercambio de música SoundCloud revisó discretamente sus condiciones de uso, introduciendo nuevas disposiciones que permiten el entrenamiento de modelos de
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
Stability AI, la empresa creadora de Stable Diffusion, ha presentado una nueva serie de modelos de audio denominada Stability Audio 3.0. Según la empresa, el modelo insignia es capaz de producir piezas musicales de calidad profesional con una duración superior a los seis minutos.
Bajo el paraguas de Stability Audio 3.0, la empresa presenta cuatro modelos: pequeño SFX (459 millones de parámetros), pequeño (459 millones de parámetros), mediano (1.400 millones de parámetros) y grande (2.700 millones de parámetros). Los dos modelos pequeños están diseñados para la generación de sonido y música en el propio dispositivo, con una duración máxima de salida de dos minutos.
Los modelos mediano y grande pueden producir composiciones completas de hasta 6 minutos y 20 segundos, conservando la estructura musical y la coherencia melódica. Eso es más del doble de la duración que se podía alcanzar con Stable Audio 2.0, lanzado en 2024.
Stability AI lanza los modelos SFX pequeño, pequeño y mediano con pesos abiertos, lo que permite a cualquiera utilizarlos y modificarlos. En 2024, la empresa presentó Stable Audio Open, que permitía la generación de música de hasta 47 segundos. Esta nueva familia de modelos supone un avance significativo con respecto a sus predecesores de código abierto.

Créditos de la imagen: StabilityAI
El modelo grande solo es accesible a través de la API y de servicios de autoalojamiento de pago. Además, las empresas con ingresos anuales superiores a 1 millón de dólares deben obtener una licencia empresarial.
Numerosas empresas, como Google y ElevenLabs, están lanzando modelos y herramientas para la generación de música. Sin embargo, como han demostrado las disputas legales en curso que involucran a Suno y Udio, las licencias de datos y las asociaciones con sellos discográficos pueden ser cruciales para la viabilidad a largo plazo de estos servicios.
El año pasado, Stability AI firmó acuerdos con Warner Music Group y Universal Music Group para desarrollar modelos y herramientas de creación musical. La empresa afirma que sus últimos modelos de audio se entrenan con datos con licencia completa.
La startup de IA está desarrollando una nueva suite de productos diseñada para músicos profesionales, aunque no ha revelado características específicas. Ethan Kaplan, anteriormente director digital de Universal Audio y Fender, se une a la empresa para dirigir la división de música profesional de Stability.
Varias empresas de IA están reforzando su credibilidad contratando a ejecutivos de la industria musical. A principios de este año, Suno nombró al antiguo director ejecutivo de Merlin, Jeremy Sirota, director comercial. ElevenLabs también incorporó a Derek Cournoyer, procedente de la editorial musical independiente Kobalt, como responsable de estrategia para su negocio musical.
Spotify promociona la IA como clave para potenciar a sus desarrolladores líderes
¿Ha alcanzado el desarrollo impulsado por la IA un hito crítico? Spotify sin duda así lo sugiere. Durante su presentación de resultados del cuarto trimestre esta semana, la empresa reveló que sus mejo
La canción "Rhythm Nation" de Janet Jackson hizo que algunos portátiles con Windows se bloquearan durante años.
Los lectores veteranos de The Verge recordarán el peculiar incidente en el que el vídeo musical "Rhythm Nation" de Janet Jackson podía bloquear ciertos portátiles con Windows simplemente con reproduci





Hogar






