A Stability AI apresenta um modelo de áudio capaz de gerar músicas de seis minutos
A Stability AI, criadora do Stable Diffusion, revelou uma nova série de modelos de áudio chamada Stability Audio 3.0. Segundo a empresa, o modelo principal é capaz de produzir faixas musicais com qualidade profissional e duração superior a seis minutos.
Sob a marca Stability Audio 3.0, a empresa está lançando quatro modelos: small SFX (459 milhões de parâmetros), small (459 milhões de parâmetros), medium (1,4 bilhão de parâmetros) e large (2,7 bilhões de parâmetros). Os dois modelos small foram projetados para geração de som e música no próprio dispositivo, com duração máxima de saída de dois minutos.
Os modelos médio e grande podem produzir composições completas de até 6 minutos e 20 segundos, preservando a estrutura musical e a coerência melódica. Isso é mais do que o dobro da duração alcançável pelo Stable Audio 2.0, lançado em 2024.
A Stability AI está lançando os modelos SFX pequeno, pequeno e médio com pesos abertos, permitindo que qualquer pessoa os utilize e modifique. Em 2024, a empresa lançou o Stable Audio Open, que possibilitava a geração de música de até 47 segundos. Essa nova família de modelos representa um avanço significativo em relação aos seus antecessores de código aberto.

Créditos da imagem: StabilityAI
O modelo grande está acessível apenas por meio da API e de serviços de auto-hospedagem pagos. Além disso, empresas com receita anual superior a US$ 1 milhão são obrigadas a obter uma licença empresarial.
Várias empresas, como Google e ElevenLabs, estão lançando modelos e ferramentas para geração de música. No entanto, como demonstraram as disputas legais em andamento envolvendo Suno e Udio, o licenciamento de dados e as parcerias com gravadoras podem ser cruciais para a viabilidade a longo prazo desses serviços.
No ano passado, a Stability AI assinou acordos com a Warner Music Group e a Universal Music Group para desenvolver modelos e ferramentas de criação musical. A empresa afirma que seus modelos de áudio mais recentes são treinados com dados totalmente licenciados.
A startup de IA está desenvolvendo um novo conjunto de produtos voltado para músicos profissionais, embora não tenha divulgado recursos específicos. Ethan Kaplan, ex-diretor digital da Universal Audio e da Fender, está ingressando na empresa para liderar a divisão de música profissional da Stability.
Várias empresas de IA estão reforçando sua credibilidade ao recrutar executivos da indústria musical. No início deste ano, a Suno nomeou o ex-CEO da Merlin, Jeremy Sirota, como diretor comercial. A ElevenLabs também contratou Derek Cournoyer, da editora independente de música Kobalt, como líder de estratégia para seu negócio musical.
Artigo relacionado
Spotify destaca a IA como elemento fundamental para capacitar seus principais desenvolvedores
O desenvolvimento impulsionado pela IA atingiu um marco importante? O Spotify certamente sugere que sim. Durante sua teleconferência sobre os resultados do quarto trimestre desta semana, a empresa rev
A música 'Rhythm Nation' de Janet Jackson fez com que alguns laptops Windows travassem por anos
Os leitores de longa data do The Verge devem se lembrar do incidente peculiar em que o videoclipe "Rhythm Nation", de Janet Jackson, podia travar determinados laptops com Windows simplesmente por ser
SoundCloud esclarece que não treina IA nas músicas dos usuários
Em fevereiro do ano passado, a plataforma de compartilhamento de músicas SoundCloud revisou discretamente seus termos de uso, introduzindo novas disposições que permitem o treinamento de modelos de IA
Recomendações de tópicos especiais relacionados
Comentários (0)
A Stability AI, criadora do Stable Diffusion, revelou uma nova série de modelos de áudio chamada Stability Audio 3.0. Segundo a empresa, o modelo principal é capaz de produzir faixas musicais com qualidade profissional e duração superior a seis minutos.
Sob a marca Stability Audio 3.0, a empresa está lançando quatro modelos: small SFX (459 milhões de parâmetros), small (459 milhões de parâmetros), medium (1,4 bilhão de parâmetros) e large (2,7 bilhões de parâmetros). Os dois modelos small foram projetados para geração de som e música no próprio dispositivo, com duração máxima de saída de dois minutos.
Os modelos médio e grande podem produzir composições completas de até 6 minutos e 20 segundos, preservando a estrutura musical e a coerência melódica. Isso é mais do que o dobro da duração alcançável pelo Stable Audio 2.0, lançado em 2024.
A Stability AI está lançando os modelos SFX pequeno, pequeno e médio com pesos abertos, permitindo que qualquer pessoa os utilize e modifique. Em 2024, a empresa lançou o Stable Audio Open, que possibilitava a geração de música de até 47 segundos. Essa nova família de modelos representa um avanço significativo em relação aos seus antecessores de código aberto.

Créditos da imagem: StabilityAI
O modelo grande está acessível apenas por meio da API e de serviços de auto-hospedagem pagos. Além disso, empresas com receita anual superior a US$ 1 milhão são obrigadas a obter uma licença empresarial.
Várias empresas, como Google e ElevenLabs, estão lançando modelos e ferramentas para geração de música. No entanto, como demonstraram as disputas legais em andamento envolvendo Suno e Udio, o licenciamento de dados e as parcerias com gravadoras podem ser cruciais para a viabilidade a longo prazo desses serviços.
No ano passado, a Stability AI assinou acordos com a Warner Music Group e a Universal Music Group para desenvolver modelos e ferramentas de criação musical. A empresa afirma que seus modelos de áudio mais recentes são treinados com dados totalmente licenciados.
A startup de IA está desenvolvendo um novo conjunto de produtos voltado para músicos profissionais, embora não tenha divulgado recursos específicos. Ethan Kaplan, ex-diretor digital da Universal Audio e da Fender, está ingressando na empresa para liderar a divisão de música profissional da Stability.
Várias empresas de IA estão reforçando sua credibilidade ao recrutar executivos da indústria musical. No início deste ano, a Suno nomeou o ex-CEO da Merlin, Jeremy Sirota, como diretor comercial. A ElevenLabs também contratou Derek Cournoyer, da editora independente de música Kobalt, como líder de estratégia para seu negócio musical.
Spotify destaca a IA como elemento fundamental para capacitar seus principais desenvolvedores
O desenvolvimento impulsionado pela IA atingiu um marco importante? O Spotify certamente sugere que sim. Durante sua teleconferência sobre os resultados do quarto trimestre desta semana, a empresa rev
A música 'Rhythm Nation' de Janet Jackson fez com que alguns laptops Windows travassem por anos
Os leitores de longa data do The Verge devem se lembrar do incidente peculiar em que o videoclipe "Rhythm Nation", de Janet Jackson, podia travar determinados laptops com Windows simplesmente por ser





Lar






