Stability AI запускает модель поколения Audio, совместимую со смартфонами

ИИ-стартап Stability AI выпустил Stable Audio Open Small, модель генерации стереозвука, которая, по его утверждению, является самой быстрой из доступных и достаточно эффективной для работы на смартфонах.
Stable Audio Open Small - результат сотрудничества между Stability AI и Arm, чипмейкером, стоящим за многими процессорами в планшетах, телефонах и других мобильных устройствах. Хотя многочисленные приложения для искусственного интеллекта, такие как Suno и Udio, могут генерировать звук, большинство из них зависят от облачной обработки и не могут работать в автономном режиме.
Stability также заявляет, что обучающий набор данных Stable Audio Open Small полностью состоит из бесплатных треков из библиотек Free Music Archive и Freesound. Это контрастирует с обучающими наборами Suno и Udio, которые, как утверждается, включают материалы, защищенные авторским правом, что создает потенциальные риски интеллектуальной собственности.
Stable Audio Open Small с 341 миллионом параметров и оптимизацией для процессоров Arm предназначен для быстрого создания коротких аудиоклипов и звуковых эффектов, таких как барабанные паттерны и инструментальные риффы. Stability AI утверждает, что может генерировать до 11 секунд аудио на смартфоне менее чем за 8 секунд.
Послушайте этот сэмпл, созданный с помощью Stable Audio Open Small:
Вот еще один пример:
У модели есть ограничения. Stable Audio Open Small принимает подсказки только на английском языке, а в документации Stability отмечается, что она не может воспроизводить реалистичный вокал или песни с высокой точностью. Кроме того, модель отличается по музыкальным жанрам из-за того, что ее обучающие данные ориентированы на Запад.
Мероприятие TechcrunchПрисоединяйтесь к TechCrunch Sessions: ИИ
Обеспечьте себе место на нашем главном событии в области ИИ с участием докладчиков из OpenAI, Anthropic и Cohere. В течение ограниченного времени вы можете посетить целый день экспертных выступлений, семинаров и ценных контактов всего за 292 доллара.
Участвуйте в выставке TechCrunch Sessions: AI
Забронируйте место для выставки на TC Sessions: AI и представить свои инновации более чем 1200 лицам, принимающим решения, без больших инвестиций. Доступно до 9 мая или до окончания поставок.
Беркли, Калифорния | 5 июня ЗАРЕГИСТРИРОВАТЬСЯ СЕЙЧАСРазработчики также должны учитывать, что Stable Audio Open Small поставляется с несколько ограниченными условиями использования. Она бесплатна для исследователей, любителей и компаний с годовым доходом менее 1 миллиона долларов, но разработчики и организации, превышающие этот доход, должны приобрести корпоративную лицензию Stability.
Компания Stability, стоящая за широко используемой моделью генерации изображений Stable Diffusion, в прошлом году получила дополнительное финансирование от инвесторов, включая Эрика Шмидта и основателя Napster Шона Паркера, чтобы помочь стабилизировать бизнес. Бывший генеральный директор и соучредитель компании Эмад Мостак (Emad Mostaque), как утверждается, не справлялся с управлением, что привело к финансовым трудностям, увольнениям сотрудников, неудачному партнерству с Canva и опасениям инвесторов относительно будущего компании.
Недавно Stability назначила нового генерального директора, включила в свой совет директоров режиссера "Титаника" Джеймса Кэмерона и выпустила несколько новых моделей генерации изображений.
Связанная статья
Arm представляет свой первый чип собственной разработки
После почти 36 лет предоставления лицензий на свои разработки таким компаниям, как Nvidia и Apple, легендарная компания Arm Holdings, специализирующаяся на полупроводниках и программном обеспечении, т
Arm предлагает стартапам гибкий доступ к своей платформе искусственного интеллекта
Компания Arm объявила, что ее самая мощная платформа искусственного интеллекта Armv9 теперь доступна для стартапов в рамках программы Flexible Access.Flexible Access — это, по сути, модель «попробуй п
Стабильность ИИ улучшает аудио -модель для чипов рук
AI Startup Stability AI объединила усилия с Arm Chip Maker, чтобы донести стабильный звук Stability Audio Open, модель искусственного интеллекта, способную генерировать звуковые эффекты, на мобильные устройства, работающие на чипах ARM. В то время как приложения, такие как Suno и Udio, могут генерировать аудио, они обычно зависят от облачной обработки, которая
Рекомендации по связанным специальным темам
Комментарии (1)

ИИ-стартап Stability AI выпустил Stable Audio Open Small, модель генерации стереозвука, которая, по его утверждению, является самой быстрой из доступных и достаточно эффективной для работы на смартфонах.
Stable Audio Open Small - результат сотрудничества между Stability AI и Arm, чипмейкером, стоящим за многими процессорами в планшетах, телефонах и других мобильных устройствах. Хотя многочисленные приложения для искусственного интеллекта, такие как Suno и Udio, могут генерировать звук, большинство из них зависят от облачной обработки и не могут работать в автономном режиме.
Stability также заявляет, что обучающий набор данных Stable Audio Open Small полностью состоит из бесплатных треков из библиотек Free Music Archive и Freesound. Это контрастирует с обучающими наборами Suno и Udio, которые, как утверждается, включают материалы, защищенные авторским правом, что создает потенциальные риски интеллектуальной собственности.
Stable Audio Open Small с 341 миллионом параметров и оптимизацией для процессоров Arm предназначен для быстрого создания коротких аудиоклипов и звуковых эффектов, таких как барабанные паттерны и инструментальные риффы. Stability AI утверждает, что может генерировать до 11 секунд аудио на смартфоне менее чем за 8 секунд.
Послушайте этот сэмпл, созданный с помощью Stable Audio Open Small:
Вот еще один пример:
У модели есть ограничения. Stable Audio Open Small принимает подсказки только на английском языке, а в документации Stability отмечается, что она не может воспроизводить реалистичный вокал или песни с высокой точностью. Кроме того, модель отличается по музыкальным жанрам из-за того, что ее обучающие данные ориентированы на Запад.
Мероприятие TechcrunchПрисоединяйтесь к TechCrunch Sessions: ИИ
Обеспечьте себе место на нашем главном событии в области ИИ с участием докладчиков из OpenAI, Anthropic и Cohere. В течение ограниченного времени вы можете посетить целый день экспертных выступлений, семинаров и ценных контактов всего за 292 доллара.
Участвуйте в выставке TechCrunch Sessions: AI
Забронируйте место для выставки на TC Sessions: AI и представить свои инновации более чем 1200 лицам, принимающим решения, без больших инвестиций. Доступно до 9 мая или до окончания поставок.
Беркли, Калифорния | 5 июня ЗАРЕГИСТРИРОВАТЬСЯ СЕЙЧАСРазработчики также должны учитывать, что Stable Audio Open Small поставляется с несколько ограниченными условиями использования. Она бесплатна для исследователей, любителей и компаний с годовым доходом менее 1 миллиона долларов, но разработчики и организации, превышающие этот доход, должны приобрести корпоративную лицензию Stability.
Компания Stability, стоящая за широко используемой моделью генерации изображений Stable Diffusion, в прошлом году получила дополнительное финансирование от инвесторов, включая Эрика Шмидта и основателя Napster Шона Паркера, чтобы помочь стабилизировать бизнес. Бывший генеральный директор и соучредитель компании Эмад Мостак (Emad Mostaque), как утверждается, не справлялся с управлением, что привело к финансовым трудностям, увольнениям сотрудников, неудачному партнерству с Canva и опасениям инвесторов относительно будущего компании.
Недавно Stability назначила нового генерального директора, включила в свой совет директоров режиссера "Титаника" Джеймса Кэмерона и выпустила несколько новых моделей генерации изображений.
Arm представляет свой первый чип собственной разработки
После почти 36 лет предоставления лицензий на свои разработки таким компаниям, как Nvidia и Apple, легендарная компания Arm Holdings, специализирующаяся на полупроводниках и программном обеспечении, т
Arm предлагает стартапам гибкий доступ к своей платформе искусственного интеллекта
Компания Arm объявила, что ее самая мощная платформа искусственного интеллекта Armv9 теперь доступна для стартапов в рамках программы Flexible Access.Flexible Access — это, по сути, модель «попробуй п
Стабильность ИИ улучшает аудио -модель для чипов рук
AI Startup Stability AI объединила усилия с Arm Chip Maker, чтобы донести стабильный звук Stability Audio Open, модель искусственного интеллекта, способную генерировать звуковые эффекты, на мобильные устройства, работающие на чипах ARM. В то время как приложения, такие как Suno и Udio, могут генерировать аудио, они обычно зависят от облачной обработки, которая





Дом






