DeepSeek выпускает R1-0528: модель искусственного интеллекта для рассуждений с открытым исходным кодом, обеспечивающая повышенную производительность в математике и кодировании при использовании одного GPU

Китайская компания DeepSeek выпустила обновлённую версию своей модели для рассуждений R1 под названием DeepSeek-R1-0528. Эта версия улучшает возможности модели в математике, программировании и логических рассуждениях в целом, позиционируя её как серьёзную альтернативу ведущим моделям с открытым исходным кодом, таким как OpenAI o3 и Google Gemini 2.5 Pro.

Технические улучшения

Обновление R1-0528 вносит значительные улучшения в глубину рассуждений и точность выводов. В частности, производительность модели на математическом бенчмарке AIME 2025 повысилась с 70% до 87,5%, что отражает более глубокий процесс рассуждений, который в среднем составляет 23 000 токенов на вопрос, по сравнению с 12 000 в предыдущей версии. Это улучшение связано с увеличением вычислительных ресурсов и алгоритмической оптимизацией, применённой во время пост-тренинга.

Помимо математических рассуждений, модель продемонстрировала улучшенную производительность в задачах по генерации кода. Согласно бенчмаркам LiveCodeBench, R1-0528 занимает позицию чуть ниже моделей OpenAI o4 mini и o3, превосходя xAI Grok 3 mini и Alibaba Qwen 3 в задачах по генерации кода.

Веса модели с открытым исходным кодом

DeepSeek продолжает свою приверженность открытому исходному коду и моделям искусственного интеллекта с открытым исходным кодом, выпуская R1-0528 под лицензией MIT, что позволяет разработчикам свободно модифицировать и развёртывать модель. Веса модели доступны на Hugging Face, а подробная документация предоставлена для локального развёртывания и интеграции API. Такой подход контрастирует с проприетарной природой многих ведущих моделей искусственного интеллекта, способствуя прозрачности и доступности в разработке ИИ.

Дистиллированная модель для лёгкого развёртывания

Признавая потребность в более доступных решениях в области искусственного интеллекта, DeepSeek также выпустила дистиллированную версию R1-0528 под названием DeepSeek-R1-0528-Qwen3-8B. Эта модель, настроенная на основе Alibaba Qwen3-8B с использованием текста, созданного R1-0528, демонстрирует передовую производительность среди моделей с открытым исходным кодом на бенчмарке AIME 2024. Она предназначена для эффективной работы на одном GPU, что делает передовые возможности искусственного интеллекта более доступными для разработчиков с ограниченными вычислительными ресурсами.

Цензурные соображения

Хотя достижения DeepSeek в области искусственного интеллекта заслуживают внимания, модель R1-0528 демонстрирует более строгую модерацию контента по сравнению с предшественниками. Независимое тестирование показало, что модель избегает или даёт ограниченные ответы на политически чувствительные темы, такие как протесты на площади Тяньаньмэнь и статус Тайваня, что соответствует китайским правилам, требующим от моделей искусственного интеллекта соблюдения ограничений по контенту.

Глобальные последствия

Выпуск R1-0528 подчёркивает растущее влияние Китая в секторе искусственного интеллекта, бросая вызов доминированию компаний из США. Способность DeepSeek разрабатывать конкурентоспособные модели искусственного интеллекта за небольшую часть стоимости их западных аналогов вызвала ответную реакцию со стороны таких компаний, как OpenAI, которые выразили обеспокоенность по поводу потенциала использования этих моделей китайским правительством. Это развитие событий подчёркивает изменение динамики в глобальном развитии искусственного интеллекта и растущую важность моделей с открытым исходным кодом в стимулировании инноваций и конкуренции.

Заключение

Модель DeepSeek R1-0528 представляет собой значительный шаг вперёд в области искусственного интеллекта с открытым исходным кодом, предлагая расширенные возможности рассуждений и доступность для разработчиков. Предоставляя как полномасштабную модель, так и дистиллированную версию, подходящую для развёртывания на одном GPU, DeepSeek стремится к демократизации технологий искусственного интеллекта. Однако соответствие модели политике модерации контента отражает сложное взаимодействие между технологическими достижениями и соблюдением нормативных требований. Поскольку ландшафт искусственного интеллекта продолжает развиваться, разработки DeepSeek, вероятно, будут играть ключевую роль в формировании будущего искусственного интеллекта с открытым исходным кодом.

Источник