Qwen выпускает Qwen3-Coder-480B-A35B-Instruct: самую мощную на сегодняшний день открытую агентскую кодовую модель

Введение

Qwen представила Qwen3-Coder-480B-A35B-Instruct — свою самую мощную открытую агентскую кодовую модель. Благодаря уникальной архитектуре Mixture-of-Experts (MoE) и обширным возможностям агентского кодирования, Qwen3-Coder устанавливает новый стандарт для открытых моделей кодирования и переопределяет возможности крупномасштабной автономной помощи разработчикам.

Архитектура модели и спецификации

Основные характеристики

* Размер модели: 480 миллиардов параметров (Mixture-of-Experts), из них 35 миллиардов активных параметров во время вывода.
* Архитектура: 160 экспертов, 8 активируются за один вывод, что обеспечивает эффективность и масштабируемость.
* Слои: 62.
* Внимание (GQA): 96 (Q), 8 (KV).
* Длина контекста: изначально поддерживает 256 000 токенов; масштабируется до 1 000 000 токенов с помощью методов экстраполяции контекста.
* Поддерживаемые языки: 358 языков программирования и разметки, включая Python, JavaScript, Java, C++, Go, Rust и многие другие.
* Тип модели: каузальная языковая модель, доступна в базовом и инструктивном вариантах.

Дизайн Mixture-of-Experts

Подход MoE активирует только подмножество параметров модели для любого заданного вывода, обеспечивая высочайшую производительность с резко сниженными вычислительными затратами и открывая беспрецедентные масштабы.

Длинный контекст и масштабируемость

Qwen3-Coder-480B-A35B-Instruct отличается нативным окном контекста в 256 К, что позволяет напрямую работать с чрезвычайно большими файлами и репозиториями. С помощью экстраполяции контекста (используя такие методы, как Yarn) он может масштабироваться до 1 миллиона токенов, что делает его пригодным для работы с крупнейшими кодовыми базами и наборами документации.

Производительность по бенчмаркам

Агентское кодирование

Qwen3-Coder разработан и оптимизирован для агентских рабочих процессов кодирования, где модель не только генерирует код, но и автономно взаимодействует с инструментами и средами разработки.

Бенчмарки

* SWE-bench-Verified: достигает передовых результатов среди открытых моделей в этом наборе сложных реальных задач кодирования, превосходя или соответствуя по производительности проприетарным закрытым моделям.
* Дополнительные агентские задачи: отлично справляется с агентским кодированием, агентским использованием браузера и агентским использованием инструментов, сравнимо с моделями высшего уровня, такими как Claude Sonnet-4.
* Широта: демонстрирует высокую квалификацию в конкурентном программировании, автоматизированном тестировании, рефакторинге кода и отладке.

Модель-основа для экосистем разработчиков

Qwen3-Coder-480B-A35B-Instruct создан как модель-основа — предназначена для использования в качестве универсальной основы для понимания кода, генерации и агентских рабочих процессов по всему цифровому миру:

* Поддерживает сильные стороны в математике и рассуждениях, унаследованные от базовой модели Qwen3.
* Легко адаптируется к различным рабочим процессам разработчиков, конвейерам CI/CD и системам проверки кода.

Qwen Code: открытый агентский инструмент командной строки

Обзор

В тандеме с моделью Qwen также выпускает в открытый доступ «Qwen Code» — агентский инструмент кодирования с командной строкой, разработанный для полного использования возможностей новой модели.

Основные характеристики

* Происхождение: разветвлён от Gemini Code (gemini-cli), обеспечивая соответствие и доступность с открытым исходным кодом.
* Пользовательские подсказки и протоколы: усовершенствованы с помощью пользовательских подсказок и расширенных протоколов вызова функций, адаптированных для Qwen3-Coder, что открывает агентские варианты использования, такие как интеграция инструментов, многоэтапное уточнение кода и внедрение контекста.
* Интеграция с разработчиками: разработан для бесперебойной работы с лучшими в своём классе инструментами сообщества, редакторами и системами CI. Поддерживает динамическое взаимодействие с кодом, задачи масштаба репозитория и прямой вызов функций.
* Расширенная поддержка инструментов: использует обновлённый синтаксический анализатор и логику вызова функций для расширения агентских рабочих процессов и синтеза программ.

Использование и расширяемость

Qwen3-Coder-480B-A35B-Instruct доступен под открытой лицензией и интегрируется с более широкой экосистемой открытого исходного кода в области искусственного интеллекта и разработки. Его можно запустить с помощью стандартных конвейеров трансформаторов или через специальный интерфейс командной строки Qwen Code, он совместим с современными стеками разработчиков.

Заключение

Qwen3-Coder-480B-A35B-Instruct знаменует собой важную веху в области искусственного интеллекта с открытым исходным кодом. Благодаря сочетанию масштабируемости, передовых агентских возможностей кодирования и инструментов, ориентированных на разработчиков, он представляет собой надёжную модель-основу для будущего автономной разработки программного обеспечения. Приверженность Qwen открытости — примером которой является выпуск как модели, так и агентского интерфейса командной строки Qwen Code — знаменует новую эру для агентского кодирования с использованием искусственного интеллекта в глобальном сообществе разработчиков.

Часто задаваемые вопросы

FAQ 1: Каковы основные преимущества Qwen3-Coder-480B-A35B-Instruct по сравнению с другими открытыми моделями кодирования?

Qwen3-Coder-480B-A35B-Instruct выделяется благодаря своему огромному масштабу — архитектура Mixture-of-Experts с 480 миллиардами параметров и 35 миллиардами активных параметров — и способности изначально обрабатывать контексты длиной 256 000 токенов (с масштабированием до 1 миллиона токенов с помощью экстраполяции контекста). Это позволяет работать со всеми крупными кодовыми базами или репозиториями за один раз. Агентский дизайн позволяет не только генерировать код, но и активно взаимодействовать с инструментами и средами разработки для автономного решения сложных задач программирования. Qwen3-Coder демонстрирует высочайшую производительность среди открытых моделей в различных кодовых и агентских бенчмарках, особенно выделяясь в SWE-bench-Verified и других задачах разработки программного обеспечения в реальных условиях.

FAQ 2: Как использовать Qwen3-Coder в своих проектах и что такое Qwen Code?

Qwen3-Coder-480B-A35B-Instruct можно получить через стандартные конвейеры Transformers или с помощью интерфейса командной строки Qwen Code, который является открытым исходным кодом и доступен на GitHub. Qwen Code, разветвлённый от Gemini Code, — это специализированный агентский инструмент кодирования, который использует расширенные пользовательские подсказки и протоколы вызова функций. Он легко интегрируется с популярными стеками разработки, поддерживает бесперебойное взаимодействие с кодовыми базами и инструментами и позволяет использовать агентские возможности Qwen3-Coder для таких задач, как генерация кода, рефакторинг, отладка и использование инструментов в автоматическом режиме непосредственно из терминала.

FAQ 3: Какие языки программирования и задачи поддерживает Qwen3-Coder?

Qwen3-Coder изначально поддерживает 358 языков программирования и разметки, включая Python, JavaScript, Java, C++, Go, Rust, HTML, SQL и многие другие. Он обладает широкими возможностями в решении различных задач кодирования, от конкурентного программирования и дополнения кода до исправления ошибок, проверки кода, понимания репозиториев в масштабе, генерации тестов, рефакторинга и многоэтапных агентских рабочих процессов. Его архитектура с длинным контекстом и модель-основа также делает его пригодным для интеграции с конвейерами CI/CD, облачными платформами и крупномасштабными средами разработки программного обеспечения.

1. Какие уникальные особенности архитектуры Qwen3-Coder-480B-A35B-Instruct обеспечивают его высокую производительность и эффективность?

Ответ: Уникальная архитектура Mixture-of-Experts (MoE) и агентское кодирование обеспечивают высокую производительность и эффективность Qwen3-Coder-480B-A35B-Instruct. Модель активирует только подмножество параметров для каждого вывода, что снижает вычислительные затраты и позволяет достичь высокой масштабируемости.

2. Какие языки программирования и разметки поддерживает Qwen3-Coder-480B-A35B-Instruct?

Ответ: Qwen3-Coder-480B-A35B-Instruct поддерживает 358 языков программирования и разметки, включая Python, JavaScript, Java, C++, Go, Rust, HTML, SQL и многие другие.

3. Какие бенчмарки используются для оценки производительности Qwen3-Coder-480B-A35B-Instruct и какие результаты он демонстрирует?

Ответ: Для оценки производительности Qwen3-Coder-480B-A35B-Instruct используются бенчмарки SWE-bench-Verified и другие агентские задачи. Модель демонстрирует передовые результаты среди открытых моделей в этих бенчмарках, превосходя или соответствуя по производительности проприетарным закрытым моделям.

4. Какие возможности предоставляет Qwen Code — агентский инструмент кодирования с командной строкой, разработанный для полного использования возможностей Qwen3-Coder-480B-A35B-Instruct?

Ответ: Qwen Code предоставляет возможности для интеграции инструментов, многоэтапного уточнения кода и внедрения контекста. Он разработан для бесперебойной работы с лучшими в своём классе инструментами сообщества, редакторами и системами CI. Поддерживает динамическое взаимодействие с кодом, задачи масштаба репозитория и прямой вызов функций.

5. Какие перспективы открывает использование Qwen3-Coder-480B-A35B-Instruct для разработчиков и экосистемы открытого исходного кода?

Ответ: Qwen3-Coder-480B-A35B-Instruct представляет собой модель-основу для будущего автономной разработки программного обеспечения. Его можно использовать в качестве универсальной основы для понимания кода, генерации и агентских рабочих процессов по всему цифровому миру. Он легко адаптируется к различным рабочим процессам разработчиков, конвейерам CI/CD и системам проверки кода.

Источник

Оставьте комментарий