Компания Stability AI, занимающаяся искусственным интеллектом, представила **Stable Audio Open Small** — модель для генерации стереозвука, которую разработчики называют самой быстрой на рынке и достаточно энергоэффективной для работы на смартфонах.
Проект стал результатом сотрудничества Stability AI и Arm, производителя процессоров для мобильных устройств. В отличие от сервисов вроде Suno и Udio, требующих облачных вычислений, новая модель работает локально, что позволяет использовать её без интернета.
Особенность Stable Audio Open Small — обучающие данные, полностью взятые из бесплатных библиотек Free Music Archive и Foursound. Это отличает её от конкурентов, чьи модели тренировались на защищённом авторским правом контенте, что создаёт юридические риски.
**Технические характеристики:**
– 341 миллион параметров;
– Оптимизация для процессоров Arm;
– Генерация звуковых эффектов (ударные, инструментальные партии);
– До 11 секунд аудио за менее чем 8 секунд на смартфоне.
**Ограничения:**
– Поддержка только английских текстовых запросов;
– Не генерирует вокал и высококачественные треки;
– Смещение в сторону западной музыки из-за обучающих данных.
Для разработчиков предусмотрены строгие условия лицензирования: бесплатное использование доступно исследователям и компаниям с годовым доходом до $1 млн