JetBrains выпускает Mellum — «открытую» ИИ-модель для написания кода

JetBrains, компания, известная своими инструментами для разработки приложений, выпустила свою первую открытую ИИ-модель для генерации кода.

В среду JetBrains открыла доступ к Mellum — модели, создающей код, которая ранее использовалась в её программных продуктах для разработки. Теперь она доступна на платформе Hugging Face. Mellum, обученная на более чем 4 триллионах токенов, имеет 4 миллиарда параметров и предназначена для завершения кода (например, дополнения фрагментов на основе контекста).

Параметры определяют способность модели решать задачи, а токены — сырые данные, которые она обрабатывает. Один миллион токенов примерно соответствует 30 000 строк кода.

«Mellum создана для интеграции в инструменты разработки (например, интеллектуальные подсказки в IDE), ИИ-ассистентов и исследования генерации кода. Она также подходит для обучения и экспериментов с тонкой настройкой», — поясняет JetBrains в техническом отчете.

Модель, выпущенная под лицензией Apache 2.0, обучалась на данных из открытых репозиториев GitHub и статей английской Википедии. Обучение заняло около 20 дней на кластере из 256 GPU Nvidia H200.

Однако Mellum требует дополнительной настройки перед использованием. Базовая версия не готова к работе «из коробки» — её необходимо дорабатывать. JetBrains предоставила несколько версий, адаптированных для Python, но предупредила, что они предназначены для оценки возможностей, а не для продакшена.

ИИ-генерация кода меняет подход к разработке, но создает новые риски. Согласно исследованию Synk (2023), более 50% компаний сталкиваются с уязвимостями в коде, созданном ИИ.

JetBrains отмечает, что Mellum может воспроизводить шаблоны из публичных репозиториев, а её подсказки не гарантируют безопасность. «Это только начало. Мы не стремимся к универсальности — мы фокусируемся. Если Mellum вдохновит на эксперименты или коллаборации, это уже успех», — заявили в компании.

Оставьте комментарий