Google официально объявил о выпуске Gemini 3.1 Pro — первого обновления в серии Gemini 3. Этот релиз — не просто незначительный патч, а целенаправленный удар по рынку «агентских» ИИ-систем, с акцентом на стабильность рассуждений, разработку программного обеспечения и надёжность использования инструментов.
Для разработчиков это означает переход на новый уровень
Мы переходим от моделей, которые просто «общаются», к моделям, которые «работают». Gemini 3.1 Pro разработан как основной механизм для автономных агентов, которые могут перемещаться по файловым системам, выполнять код и решать научные задачи с эффективностью, которая теперь конкурирует — а в некоторых случаях и превосходит — самые передовые модели в отрасли.
Масштабные возможности и точные результаты
Одним из наиболее значительных технических обновлений является работа с масштабами. Gemini 3.1 Pro поддерживает контекст ввода в 1 миллион токенов. Для разработчиков программного обеспечения это означает, что теперь можно передать модели весь репозиторий кода среднего размера, и у неё будет достаточно «памяти», чтобы понять межфайловые зависимости, не теряя при этом контекста.
Однако главная новость — это ограничение вывода в 65 тысяч токенов. Это значительное увеличение для разработчиков, создающих генераторы длинных текстов. Независимо от того, создаёте ли вы 100-страничное техническое руководство или сложное мультимодульное приложение на Python, модель теперь может выполнить работу за один раз, не сталкиваясь с резкой стеной «максимального количества токенов».
Удвоение усилий в области рассуждений
Если Gemini 3.0 был посвящён внедрению «глубокого мышления», то Gemini 3.1 — это работа над эффективностью этого мышления. Показатели по строгим бенчмаркам значительно выросли:
| Benchmark | Score | Что это измеряет |
| — | — | — |
| ARC-AGI-2 | 77,1% | Способность решать совершенно новые логические задачи |
| GPQA Diamond | 94,1% | Научные рассуждения на уровне выпускников |
| SciCode | 58,9% | Программирование на Python для научных вычислений |
| Terminal-Bench Hard | 53,8% | Агентское кодирование и использование терминала |
| Humanity’s Last Exam (HLE) | 44,7% | Рассуждения на уровне, близком к человеческому |
Показатель 77,1% на ARC-AGI-2 — это ключевая цифра. Команда Google утверждает, что это более чем вдвое превышает производительность рассуждений по сравнению с оригинальным Gemini 3 Pro. Это означает, что модель гораздо реже полагается на сопоставление шаблонов из обучающих данных и более способна «вычислить» решение при столкновении с новым пограничным случаем в наборе данных.
Агентский инструментарий: пользовательские инструменты и «Антигравитация»
Команда Google делает ставку на терминал разработчика. Наряду с основной моделью они запустили специализированную конечную точку: gemini-3.1-pro-preview-customtools. Эта конечная точка оптимизирована для разработчиков, которые сочетают команды bash с пользовательскими функциями.
Этот выпуск также глубоко интегрирован с Google Antigravity — новой платформой разработки агентов компании. Разработчики теперь могут использовать новый уровень мышления «среднего» уровня. Это позволяет вам регулировать «бюджет рассуждений» — использовать глубокое мышление для сложной отладки, а для стандартных вызовов API переходить на средний или низкий уровень, чтобы сэкономить на задержках и стоимости.
Изменения в API и новые методы работы с файлами
Для тех, кто уже работает с Gemini API, есть небольшое, но важное изменение. В API взаимодействий v1beta поле totalreasoningtokens было переименовано в totalthoughttokens. Это изменение соответствует «подписям мыслей», представленным в семействе Gemini — зашифрованным представлениям внутреннего рассуждения модели, которые должны передаваться обратно в модель для сохранения контекста в многоходовых агентских рабочих процессах.
Экономика интеллекта
Цены на Gemini 3.1 Pro Preview остаются агрессивными. Для запросов объёмом менее 200 тысяч токенов стоимость ввода составляет 2 доллара за 1 миллион токенов, а вывода — 12 долларов за 1 миллион. Для контекстов, превышающих 200 тысяч, цена составляет 4 доллара за ввод и 18 долларов за вывод.
По сравнению с конкурентами, такими как Claude Opus 4.6 или GPT-5.2, команда Google позиционирует Gemini 3.1 Pro как «лидера по эффективности». Согласно данным Artificial Analysis, Gemini 3.1 Pro теперь занимает первое место в их индексе интеллекта, при этом затраты на его запуск примерно вдвое меньше, чем у ближайших аналогов.
Ключевые выводы
* Масштабное окно контекста 1М/65К: модель поддерживает окно ввода в 1 миллион токенов для крупномасштабных данных и репозиториев, при этом значительно увеличивая лимит вывода до 65 тысяч токенов для генерации длинных кодов и документов.
* Скачок в логике и рассуждениях: производительность по бенчмарку ARC-AGI-2 достигла 77,1%, что более чем вдвое превышает возможности рассуждений предыдущих версий. Также был достигнут показатель 94,1% по GPQA Diamond для научных задач уровня выпускников.
* Специализированные агентские конечные точки: команда Google представила специализированную конечную точку gemini-3.1-pro-preview-customtools. Она специально оптимизирована для приоритизации команд bash и системных инструментов (таких как viewfile и searchcode) для более надёжных автономных агентов.
* Изменение в API: разработчики должны обновить свои кодовые базы, поскольку поле totalreasoningtokens было переименовано в totalthoughttokens в v1beta API взаимодействий, чтобы лучше соответствовать внутренней обработке «мыслей» модели.
* Улучшенная обработка файлов и мультимедиа: лимит размера файлов в API увеличен с 20 МБ до 100 МБ. Кроме того, разработчики теперь могут передавать URL-адреса YouTube напрямую в запрос, позволяя модели анализировать видеоконтент без необходимости загрузки или повторной загрузки файлов.
1. Какие ключевые технические обновления были внесены в модель Gemini 3.1 Pro?
В модель Gemini 3.1 Pro были внесены следующие ключевые технические обновления:
* поддержка контекста ввода в 1 миллион токенов;
* ограничение вывода в 65 тысяч токенов;
* удвоение усилий в области рассуждений, что привело к значительному росту показателей по строгим бенчмаркам;
* запуск специализированной конечной точки gemini-3.1-pro-preview-customtools, оптимизированной для разработчиков, которые сочетают команды bash с пользовательскими функциями;
* увеличение лимита размера файлов в API с 20 МБ до 100 МБ и возможность передачи URL-адресов YouTube напрямую в запрос.
2. Какие показатели бенчмарков были улучшены в Gemini 3.1 Pro и что они означают?
В Gemini 3.1 Pro были улучшены следующие показатели бенчмарков:
* ARC-AGI-2 — 77,1%: способность решать совершенно новые логические задачи;
* GPQA Diamond — 94,1%: научные рассуждения на уровне выпускников;
* SciCode — 58,9%: программирование на Python для научных вычислений;
* Terminal-Bench Hard — 53,8%: агентское кодирование и использование терминала;
* Humanity’s Last Exam (HLE) — 44,7%: рассуждения на уровне, близком к человеческому.
3. Какие изменения были внесены в API для работы с Gemini 3.1 Pro?
В API для работы с Gemini 3.1 Pro было внесено следующее изменение:
* поле totalreasoningtokens было переименовано в totalthoughttokens в v1beta API взаимодействий. Это изменение соответствует «подписям мыслей», представленным в семействе Gemini — зашифрованным представлениям внутреннего рассуждения модели, которые должны передаваться обратно в модель для сохранения контекста в многоходовых агентских рабочих процессах.
4. Какие экономические преимущества предлагает Gemini 3.1 Pro по сравнению с конкурентами?
Согласно данным Artificial Analysis, Gemini 3.1 Pro занимает первое место в их индексе интеллекта, при этом затраты на его запуск примерно вдвое меньше, чем у ближайших аналогов. Для запросов объёмом менее 200 тысяч токенов стоимость ввода составляет 2 доллара за 1 миллион токенов, а вывода — 12 долларов за 1 миллион. Для контекстов, превышающих 200 тысяч, цена составляет 4 доллара за ввод и 18 долларов за вывод.
5. Какие новые возможности появились у разработчиков при работе с Gemini 3.1 Pro?
При работе с Gemini 3.1 Pro у разработчиков появились следующие новые возможности:
* работа с крупномасштабными данными и репозиториями благодаря поддержке контекста ввода в 1 миллион токенов;
* генерация длинных кодов и документов благодаря увеличению лимита вывода до 65 тысяч токенов;
* использование специализированной конечной точки gemini-3.1-pro-preview-customtools для приоритизации команд bash и системных инструментов;
* увеличение лимита размера файлов в API до 100 МБ;
* возможность передачи URL-адресов YouTube напрямую в запрос для анализа видеоконтента.