Stability AI, 스마트폰과 호환되는 오디오 생성 모델 출시

AI 스타트업인 Stability AI는 스마트폰에서 작동하기에 가장 빠르고 효율적이라고 주장하는 스테레오 오디오 생성 모델인 Stable Audio Open Small을 출시했습니다.
스테이블 오디오 오픈 스몰은 태블릿, 휴대폰 및 기타 모바일 기기의 여러 프로세서를 제조하는 칩 제조업체인 Arm과 Stability AI의 파트너십을 통해 탄생했습니다. Suno, Udio 등 수많은 AI 앱이 오디오를 생성할 수 있지만 대부분 클라우드 프로세싱에 의존하고 오프라인에서는 작동하지 않습니다.
또한 Stable Audio Open Small의 훈련 데이터 세트는 전적으로 무료 음악 아카이브 및 프리사운드 라이브러리의 로열티가 없는 트랙으로 구성되어 있습니다. 이는 저작권이 있는 자료가 포함되어 있어 잠재적인 지적 재산권 위험이 있는 것으로 알려진 Suno 및 Udio의 트레이닝 세트와는 대조적입니다.
3억 4100만 개의 파라미터와 Arm CPU에 최적화된 Stable Audio Open Small은 드럼 패턴이나 악기 리프와 같은 짧은 오디오 클립과 사운드 효과를 빠르게 생성할 수 있도록 설계되었습니다. Stability AI는 스마트폰에서 최대 11초 분량의 오디오를 8초 이내에 생성할 수 있다고 주장합니다.
스테이블 오디오 오픈 스몰로 만든 이 샘플을 들어보세요:
또 다른 예가 있습니다:
이 모델에는 한계가 있습니다. 스테이블 오디오 오픈 스몰은 영어로 된 프롬프트만 허용하며, 스테이블은 문서에서 사실적인 보컬이나 고음질 노래를 생성할 수 없다고 언급하고 있습니다. 또한 서양 중심의 학습 데이터로 인해 음악 장르에 따라 성능이 달라집니다.
테크크런치 이벤트테크크런치 세션에 참여하세요: AI
OpenAI, Anthropic, Cohere의 연사가 참여하는 최고의 AI 업계 이벤트에서 자리를 확보하세요. 한정된 기간 동안 단 $292로 하루 종일 진행되는 전문가 강연, 워크샵, 귀중한 네트워킹에 참여하세요.
테크크런치 세션에 참가하세요: AI
TC 세션에서 전시 공간을 예약하세요: AI에서 큰 투자 없이 1,200명 이상의 의사 결정권자에게 혁신을 소개하세요. 5월 9일까지 또는 재고 소진 시까지 이용 가능합니다.
캘리포니아 버클리 | 6월 5일 지금 등록하기개발자는 Stable Audio 오픈 스몰에는 다소 제한적인 사용 약관이 적용된다는 점에 유의해야 합니다. 연구자, 취미 활동가 및 연간 매출이 100만 달러 미만인 기업에게는 무료로 제공되지만, 그 이상의 개발자 및 조직은 Stability의 엔터프라이즈 라이선스를 구매해야 합니다.
널리 사용되는 이미지 생성 모델인 스테이블 디퓨전의 개발사인 Stability는 지난해 에릭 슈미트, 냅스터 창업자 션 파커 등의 투자자로부터 추가 자금을 확보하여 비즈니스 안정화에 힘을 보탰습니다. 전 CEO이자 공동 창업자인 에마드 모스타크의 잘못된 경영으로 인해 재정적 어려움, 직원 이탈, 캔바와의 파트너십 실패, 회사의 미래에 대한 투자자들의 우려로 이어진 것으로 알려졌습니다.
최근 Stability는 새로운 CEO를 임명하고 타이타닉의 감독인 제임스 카메론을 이사회에 영입했으며, 새로운 이미지 생성 모델을 여러 개 출시했습니다.
관련 기사
ARM, 첫 자체 개발 칩 설계 공개
Nvidia와 Apple 같은 기업들에 설계 라이선스를 제공해 온 지 약 36년 만에, 유서 깊은 반도체 및 소프트웨어 기업인 Arm Holdings가 이제 자체 칩 생산에 나서고 있다.화요일 샌프란시스코에서 열린 행사에서 이 회사는 AI 데이터센터 추론 워크로드를 위해 설계된 양산 준비가 완료된 프로세서인 'Arm AGI CPU'를 공개
Arm은 신생 기업들에게 자사의 엣지 AI 플랫폼에 대한 유연한 접근성을 제공합니다.
Arm은 자사의 가장 강력한 엣지 AI 플랫폼인 Armv9이 이제 스타트업 대상으로 '플렉서블 액세스(Flexible Access)' 프로그램을 통해 제공된다고 발표했습니다.Flexible Access는 칩 설계자를 위한 '구매 전 체험' 모델로, 기업들에게 Arm의 광범위한 기술, 도구 및 리소스에 대한 저비용 또는 무비용(자격 요건을 충족하는 스타트업의
안정성 AI는 팔 칩의 오디오 모델을 향상시킵니다
AI 스타트 업 안정성 AI는 Chipmaker Arm과 힘을 합쳐서 안정성의 안정적인 오디오를 열어 놓았습니다. Suno 및 Udio와 같은 앱은 오디오를 생성 할 수 있지만 일반적으로 클라우드 처리에 의존합니다.
관련 특별 주제 추천
의견 (1)
0/500

AI 스타트업인 Stability AI는 스마트폰에서 작동하기에 가장 빠르고 효율적이라고 주장하는 스테레오 오디오 생성 모델인 Stable Audio Open Small을 출시했습니다.
스테이블 오디오 오픈 스몰은 태블릿, 휴대폰 및 기타 모바일 기기의 여러 프로세서를 제조하는 칩 제조업체인 Arm과 Stability AI의 파트너십을 통해 탄생했습니다. Suno, Udio 등 수많은 AI 앱이 오디오를 생성할 수 있지만 대부분 클라우드 프로세싱에 의존하고 오프라인에서는 작동하지 않습니다.
또한 Stable Audio Open Small의 훈련 데이터 세트는 전적으로 무료 음악 아카이브 및 프리사운드 라이브러리의 로열티가 없는 트랙으로 구성되어 있습니다. 이는 저작권이 있는 자료가 포함되어 있어 잠재적인 지적 재산권 위험이 있는 것으로 알려진 Suno 및 Udio의 트레이닝 세트와는 대조적입니다.
3억 4100만 개의 파라미터와 Arm CPU에 최적화된 Stable Audio Open Small은 드럼 패턴이나 악기 리프와 같은 짧은 오디오 클립과 사운드 효과를 빠르게 생성할 수 있도록 설계되었습니다. Stability AI는 스마트폰에서 최대 11초 분량의 오디오를 8초 이내에 생성할 수 있다고 주장합니다.
스테이블 오디오 오픈 스몰로 만든 이 샘플을 들어보세요:
또 다른 예가 있습니다:
이 모델에는 한계가 있습니다. 스테이블 오디오 오픈 스몰은 영어로 된 프롬프트만 허용하며, 스테이블은 문서에서 사실적인 보컬이나 고음질 노래를 생성할 수 없다고 언급하고 있습니다. 또한 서양 중심의 학습 데이터로 인해 음악 장르에 따라 성능이 달라집니다.
테크크런치 이벤트테크크런치 세션에 참여하세요: AI
OpenAI, Anthropic, Cohere의 연사가 참여하는 최고의 AI 업계 이벤트에서 자리를 확보하세요. 한정된 기간 동안 단 $292로 하루 종일 진행되는 전문가 강연, 워크샵, 귀중한 네트워킹에 참여하세요.
테크크런치 세션에 참가하세요: AI
TC 세션에서 전시 공간을 예약하세요: AI에서 큰 투자 없이 1,200명 이상의 의사 결정권자에게 혁신을 소개하세요. 5월 9일까지 또는 재고 소진 시까지 이용 가능합니다.
캘리포니아 버클리 | 6월 5일 지금 등록하기개발자는 Stable Audio 오픈 스몰에는 다소 제한적인 사용 약관이 적용된다는 점에 유의해야 합니다. 연구자, 취미 활동가 및 연간 매출이 100만 달러 미만인 기업에게는 무료로 제공되지만, 그 이상의 개발자 및 조직은 Stability의 엔터프라이즈 라이선스를 구매해야 합니다.
널리 사용되는 이미지 생성 모델인 스테이블 디퓨전의 개발사인 Stability는 지난해 에릭 슈미트, 냅스터 창업자 션 파커 등의 투자자로부터 추가 자금을 확보하여 비즈니스 안정화에 힘을 보탰습니다. 전 CEO이자 공동 창업자인 에마드 모스타크의 잘못된 경영으로 인해 재정적 어려움, 직원 이탈, 캔바와의 파트너십 실패, 회사의 미래에 대한 투자자들의 우려로 이어진 것으로 알려졌습니다.
최근 Stability는 새로운 CEO를 임명하고 타이타닉의 감독인 제임스 카메론을 이사회에 영입했으며, 새로운 이미지 생성 모델을 여러 개 출시했습니다.
ARM, 첫 자체 개발 칩 설계 공개
Nvidia와 Apple 같은 기업들에 설계 라이선스를 제공해 온 지 약 36년 만에, 유서 깊은 반도체 및 소프트웨어 기업인 Arm Holdings가 이제 자체 칩 생산에 나서고 있다.화요일 샌프란시스코에서 열린 행사에서 이 회사는 AI 데이터센터 추론 워크로드를 위해 설계된 양산 준비가 완료된 프로세서인 'Arm AGI CPU'를 공개
Arm은 신생 기업들에게 자사의 엣지 AI 플랫폼에 대한 유연한 접근성을 제공합니다.
Arm은 자사의 가장 강력한 엣지 AI 플랫폼인 Armv9이 이제 스타트업 대상으로 '플렉서블 액세스(Flexible Access)' 프로그램을 통해 제공된다고 발표했습니다.Flexible Access는 칩 설계자를 위한 '구매 전 체험' 모델로, 기업들에게 Arm의 광범위한 기술, 도구 및 리소스에 대한 저비용 또는 무비용(자격 요건을 충족하는 스타트업의
안정성 AI는 팔 칩의 오디오 모델을 향상시킵니다
AI 스타트 업 안정성 AI는 Chipmaker Arm과 힘을 합쳐서 안정성의 안정적인 오디오를 열어 놓았습니다. Suno 및 Udio와 같은 앱은 오디오를 생성 할 수 있지만 일반적으로 클라우드 처리에 의존합니다.





집






