Stability AI, 6분 길이의 노래를 생성할 수 있는 오디오 모델 공개
Stable Diffusion을 개발한 Stability AI가 ‘Stability Audio 3.0’이라는 새로운 오디오 모델 시리즈를 공개했다. 회사에 따르면, 이 플래그십 모델은 6분을 넘는 길이의 전문가급 음악 트랙을 생성할 수 있다.
스태빌리티 오디오 3.0 라인업에는 소형 SFX(4억 5,900만 파라미터), 소형(4억 5,900만 파라미터), 중형(14억 파라미터), 대형(27억 파라미터) 등 총 4가지 모델이 포함됩니다. 두 가지 소형 모델은 기기 내 사운드 및 음악 생성을 위해 설계되었으며, 최대 출력 길이는 2분입니다.
미디엄 및 라지 모델은 음악적 구조와 선율적 일관성을 유지한 채 최대 6분 20초 길이의 완성된 곡을 생성할 수 있습니다. 이는 2024년에 출시된 Stable Audio 2.0이 달성할 수 있는 재생 시간의 두 배 이상입니다.
Stability AI는 소형 SFX, 소형 및 중형 모델의 가중치를 공개하여 누구나 이를 사용하고 수정할 수 있도록 합니다. 2024년, 이 회사는 최대 47초 분량의 음악 생성이 가능한 'Stable Audio Open'을 선보인 바 있습니다. 이 새로운 모델 제품군은 이전 오픈소스 모델들에 비해 상당한 발전을 보여줍니다.

이미지 출처: StabilityAI
대형 모델은 API 및 유료 자체 호스팅 서비스를 통해서만 이용할 수 있습니다. 또한, 연간 매출이 100만 달러를 초과하는 기업은 엔터프라이즈 라이선스를 취득해야 합니다.
구글(Google)과 일레븐랩스(ElevenLabs)를 비롯한 수많은 기업이 음악 생성 모델과 도구를 출시하고 있습니다. 그러나 수노(Suno)와 우디오(Udio)를 둘러싼 지속적인 법적 분쟁이 보여주듯, 데이터 라이선싱과 음반사와의 파트너십은 이러한 서비스의 장기적인 생존을 위해 결정적일 수 있습니다.
작년, Stability AI는 워너 뮤직 그룹(Warner Music Group) 및 유니버설 뮤직 그룹(Universal Music Group)과 모델 및 음악 제작 도구 개발을 위한 협약을 체결했습니다. 이 회사는 자사의 최신 오디오 모델이 완전히 라이선스가 부여된 데이터로 훈련되었다고 밝혔습니다.
이 AI 스타트업은 구체적인 기능은 공개하지 않았으나, 전문 음악가를 위해 맞춤화된 새로운 제품군을 개발 중이다. 유니버설 오디오(Universal Audio)와 펜더(Fender)의 전 최고 디지털 책임자(CDO)인 에단 카플란(Ethan Kaplan)이 스태빌리티의 전문 음악 사업부를 이끌기 위해 합류했다.
여러 AI 기업들이 음악 업계 임원들을 영입하며 신뢰도를 높이고 있다. 올해 초, 수노(Suno)는 전 멀린(Merlin) CEO 제레미 시로타를 최고상업책임자(CCO)로 임명했다. 일레븐랩스(ElevenLabs) 역시 인디 음악 퍼블리셔 코발트(Kobalt) 출신의 데릭 코르노이어를 음악 사업 전략 책임자로 영입했다.
관련 기사
스포티파이, 선도적 개발자 역량 강화의 핵심으로 인공지능(AI) 강조
인공지능(AI) 기반 개발이 중대한 이정표에 도달했는가? 스포티파이는 분명히 그렇다고 주장한다. 이번 주 4분기 실적 발표에서 회사는 최고 엔지니어들이 "지난 12월 이후 단 한 줄의 코드도 작성하지 않았다"고 밝혔다. 이 발언은 스포티파이 공동 CEO 구스타프 소더스트룀이 한 것으로, 그는 회사가 제품 개발 속도를 높이기 위해 AI를 어떻게 활용하고 있는
자넷 잭슨의 '리듬 네이션'으로 인해 일부 Windows 노트북에서 수년 동안 충돌이 발생했습니다.
더 버지의 오랜 독자들은 자넷 잭슨의 "리듬 네이션" 뮤직 비디오가 근처에서 재생되는 것만으로도 특정 Windows 랩톱이 충돌하는 특이한 사건을 기억할 것입니다. 이제 PCWorld가 강조한 블로그 게시물에서 Microsoft 직원 Raymond Chen은 이 문제를 해결하기 위해 고안된 필터가 "최소한 Windows 7"까지는 그대로 유지되었다고 밝혔습
사운드클라우드, 사용자 음악에 AI를 학습시키지 않는다고 해명
작년 2월, 음악 공유 플랫폼인 사운드클라우드는 이용 약관을 신중하게 개정하여 사용자가 생성한 자료를 사용하여 AI 모델을 학습시킬 수 있는 새로운 조항을 도입했다고 TechCrunch가 보도했습니다. 이 회사는 실제로 사용자 콘텐츠를 모델 학습에 사용한 적은 없다고 밝혔지만, 향후 이러한 사용의 가능성을 열어두고 있습니다.사운드클라우드의 수석 부사장이자
관련 특별 주제 추천
의견 (0)
0/500
Stable Diffusion을 개발한 Stability AI가 ‘Stability Audio 3.0’이라는 새로운 오디오 모델 시리즈를 공개했다. 회사에 따르면, 이 플래그십 모델은 6분을 넘는 길이의 전문가급 음악 트랙을 생성할 수 있다.
스태빌리티 오디오 3.0 라인업에는 소형 SFX(4억 5,900만 파라미터), 소형(4억 5,900만 파라미터), 중형(14억 파라미터), 대형(27억 파라미터) 등 총 4가지 모델이 포함됩니다. 두 가지 소형 모델은 기기 내 사운드 및 음악 생성을 위해 설계되었으며, 최대 출력 길이는 2분입니다.
미디엄 및 라지 모델은 음악적 구조와 선율적 일관성을 유지한 채 최대 6분 20초 길이의 완성된 곡을 생성할 수 있습니다. 이는 2024년에 출시된 Stable Audio 2.0이 달성할 수 있는 재생 시간의 두 배 이상입니다.
Stability AI는 소형 SFX, 소형 및 중형 모델의 가중치를 공개하여 누구나 이를 사용하고 수정할 수 있도록 합니다. 2024년, 이 회사는 최대 47초 분량의 음악 생성이 가능한 'Stable Audio Open'을 선보인 바 있습니다. 이 새로운 모델 제품군은 이전 오픈소스 모델들에 비해 상당한 발전을 보여줍니다.

이미지 출처: StabilityAI
대형 모델은 API 및 유료 자체 호스팅 서비스를 통해서만 이용할 수 있습니다. 또한, 연간 매출이 100만 달러를 초과하는 기업은 엔터프라이즈 라이선스를 취득해야 합니다.
구글(Google)과 일레븐랩스(ElevenLabs)를 비롯한 수많은 기업이 음악 생성 모델과 도구를 출시하고 있습니다. 그러나 수노(Suno)와 우디오(Udio)를 둘러싼 지속적인 법적 분쟁이 보여주듯, 데이터 라이선싱과 음반사와의 파트너십은 이러한 서비스의 장기적인 생존을 위해 결정적일 수 있습니다.
작년, Stability AI는 워너 뮤직 그룹(Warner Music Group) 및 유니버설 뮤직 그룹(Universal Music Group)과 모델 및 음악 제작 도구 개발을 위한 협약을 체결했습니다. 이 회사는 자사의 최신 오디오 모델이 완전히 라이선스가 부여된 데이터로 훈련되었다고 밝혔습니다.
이 AI 스타트업은 구체적인 기능은 공개하지 않았으나, 전문 음악가를 위해 맞춤화된 새로운 제품군을 개발 중이다. 유니버설 오디오(Universal Audio)와 펜더(Fender)의 전 최고 디지털 책임자(CDO)인 에단 카플란(Ethan Kaplan)이 스태빌리티의 전문 음악 사업부를 이끌기 위해 합류했다.
여러 AI 기업들이 음악 업계 임원들을 영입하며 신뢰도를 높이고 있다. 올해 초, 수노(Suno)는 전 멀린(Merlin) CEO 제레미 시로타를 최고상업책임자(CCO)로 임명했다. 일레븐랩스(ElevenLabs) 역시 인디 음악 퍼블리셔 코발트(Kobalt) 출신의 데릭 코르노이어를 음악 사업 전략 책임자로 영입했다.
스포티파이, 선도적 개발자 역량 강화의 핵심으로 인공지능(AI) 강조
인공지능(AI) 기반 개발이 중대한 이정표에 도달했는가? 스포티파이는 분명히 그렇다고 주장한다. 이번 주 4분기 실적 발표에서 회사는 최고 엔지니어들이 "지난 12월 이후 단 한 줄의 코드도 작성하지 않았다"고 밝혔다. 이 발언은 스포티파이 공동 CEO 구스타프 소더스트룀이 한 것으로, 그는 회사가 제품 개발 속도를 높이기 위해 AI를 어떻게 활용하고 있는
자넷 잭슨의 '리듬 네이션'으로 인해 일부 Windows 노트북에서 수년 동안 충돌이 발생했습니다.
더 버지의 오랜 독자들은 자넷 잭슨의 "리듬 네이션" 뮤직 비디오가 근처에서 재생되는 것만으로도 특정 Windows 랩톱이 충돌하는 특이한 사건을 기억할 것입니다. 이제 PCWorld가 강조한 블로그 게시물에서 Microsoft 직원 Raymond Chen은 이 문제를 해결하기 위해 고안된 필터가 "최소한 Windows 7"까지는 그대로 유지되었다고 밝혔습





집






