Alibaba представила Qwen 3 — семейство «гибридных» моделей ИИ для рассуждений

Китайская технологическая компания Alibaba представила семейство ИИ-моделей Qwen 3, которые, по заявлениям компании, не уступают, а в некоторых случаях превосходят лучшие разработки Google и OpenAI. Большинство моделей уже доступны или скоро появятся для загрузки по открытой лицензии через платформы разработки ИИ Hugging Face и GitHub. Размер моделей варьируется от 0,6 до 235 миллиардов параметров — показателя, который примерно отражает способность модели решать задачи. Как правило, модели с большим числом параметров демонстрируют более высокую производительность.

Появление китайских моделей, таких как Qwen, усилило давление на американские лаборатории, включая OpenAI, вынуждая их ускорять разработку более совершенных технологий. Это также привело к введению регуляторных ограничений, направленных на затруднение доступа китайских компаний к чипам, необходимым для обучения ИИ.

Согласно Alibaba, Qwen 3 использует гибридный подход: модели могут долго «рассуждать» над сложными задачами или мгновенно отвечать на простые запросы. Эта способность к логическому выводу позволяет моделям самостоятельно проверять факты, аналогично OpenAI o3, но с увеличением задержки. «Мы объединили режимы с активным и пассивным мышлением, предоставив пользователям контроль над когнитивными ресурсами», — пояснили разработчики в блоге.

Модели Qwen 3 поддерживают 119 языков и обучены на 36 триллионах токенов — базовых единиц данных. Один миллион токенов эквивалентен примерно 750 000 слов. Для обучения использовались учебники, пары вопросов-ответов, фрагменты кода и другие данные. По словам Alibaba, эти улучшения значительно повысили производительность Qwen 3 по сравнению с предшественником Qwen 2.

Флагманская модель Qwen-3-235B-A22B превзошла o3-mini от OpenAI в тестах: на платформе Codeforces, в математическом бенчмарке AIME и тесте BFCL, оценивающем логическое мышление. Однако эта модель пока недоступна публично. Самая крупная из открытых версий, Qwen3-32B, конкурирует с коммерческими ИИ-моделями, включая DeepSeek R1, и превосходит OpenAI o1 в тестах вроде LiveBench.

Alibaba также отмечает улучшенную интеграцию инструментов, точное следование инструкциям и работу с форматами данных. Помимо локальной установки, Qwen 3 доступен через облачные платформы Fireworks AI и Hyperbolic.

Оставьте комментарий