Stability AI выпустила модель для генерации аудио, работающую на смартфонах

Компания Stability AI, занимающаяся искусственным интеллектом, представила **Stable Audio Open Small** — модель для генерации стереозвука, которую разработчики называют самой быстрой на рынке и достаточно энергоэффективной для работы на смартфонах.

Проект стал результатом сотрудничества Stability AI и Arm, производителя процессоров для мобильных устройств. В отличие от сервисов вроде Suno и Udio, требующих облачных вычислений, новая модель работает локально, что позволяет использовать её без интернета.

Особенность Stable Audio Open Small — обучающие данные, полностью взятые из бесплатных библиотек Free Music Archive и Foursound. Это отличает её от конкурентов, чьи модели тренировались на защищённом авторским правом контенте, что создаёт юридические риски.

**Технические характеристики:**
— 341 миллион параметров;
— Оптимизация для процессоров Arm;
— Генерация звуковых эффектов (ударные, инструментальные партии);
— До 11 секунд аудио за менее чем 8 секунд на смартфоне.

**Ограничения:**
— Поддержка только английских текстовых запросов;
— Не генерирует вокал и высококачественные треки;
— Смещение в сторону западной музыки из-за обучающих данных.

Для разработчиков предусмотрены строгие условия лицензирования: бесплатное использование доступно исследователям и компаниям с годовым доходом до $1 млн

Оставьте комментарий Отменить ответ