Компания xAI представила Grok-4-Fast — оптимизированный по стоимости преемник Grok-4, который объединяет «логическое» и «нелогическое» поведение в едином наборе весовых коэффициентов, управляемом через системные подсказки. Модель предназначена для высокопроизводительного поиска, кодирования и ответов на вопросы.
Особенности модели
- Контекст: модель имеет окно контекста в 2 миллиона токенов.
- Обучение: Grok-4-Fast обучен сквозным методом с использованием инструментального обучения с подкреплением (RL), который решает, когда просматривать веб-страницы, выполнять код или вызывать инструменты.
- Архитектура: предыдущие версии Grok разделяли «логические» и «нелогические» ответы на длинные и короткие цепочки. Grok-4-Fast объединяет эти веса, что снижает задержку и количество токенов.
Применение в поиске и агентских задачах
Grok-4-Fast был обучен сквозным методом с использованием инструментального обучения с подкреплением и показывает прирост по бенчмаркам, ориентированным на поиск:
- BrowseComp — 44,9%;
- SimpleQA — 95,0%;
- Reka Research — 66,0%;
- китайские варианты (например, BrowseComp-zh) — 51,2%.
xAI также приводит данные частных боевых испытаний на LMArena, где Grok-4-Fast-search (кодовое имя «menlo») занимает первое место в Search Arena с 1163 Elo, а текстовый вариант (кодовое имя «tahoe») занимает восьмое место в Text Arena, примерно наравне с Grok-4-0709.
Показатели производительности и эффективности
На внутренних и публичных бенчмарках Grok-4-Fast демонстрирует результаты фронтирного класса, сокращая при этом использование токенов. xAI сообщает о результатах pass@1:
- AIME 2025 (без инструментов) — 92,0%;
- HMMT 2025 (без инструментов) — 93,3%;
- GPQA Diamond — 85,7%;
- LiveCodeBench (январь — май) — 80,0%.
Компания утверждает, что модель использует примерно на 40% меньше «мыслительных» токенов в среднем, при этом достигая сопоставимой точности. Это позволяет снизить цену на ~98% по сравнению с Grok-4 при использовании меньшего количества токенов и новых цен за токен.
Развёртывание и цена
Модель доступна всем пользователям в режимах Grok Fast и Auto через веб и мобильные устройства. Режим Auto будет выбирать Grok-4-Fast для сложных запросов, чтобы улучшить задержку без потери качества. Впервые бесплатные пользователи получают доступ к последнему уровню моделей xAI.
Для разработчиков xAI предлагает два SKU — grok-4-fast-reasoning и grok-4-fast-non-reasoning — оба с контекстом в 2 миллиона токенов.
Цены (xAI API):
- $0,20 / 1 миллион входных токенов (менее 128 тысяч);
- $0,40 / 1 миллион входных токенов (128 тысяч и более);
- $0,50 / 1 миллион выходных токенов (менее 128 тысяч);
- $1,00 / 1 миллион выходных токенов (128 тысяч и более);
- $0,05 / 1 миллион кэшированных входных токенов.
Технические выводы:
1. Унифицированная модель + контекст в 2 миллиона токенов. Grok-4-Fast использует единое весовое пространство для «логического» и «нелогического» поведения, управляемое через подсказки, с окном в 2 миллиона токенов для обоих SKU.
2. Цены для масштабирования. Цены API начинаются от $0,20/М за входные данные, $0,50/М за выходные данные, с кэшированными входными данными по $0,05/М и более высокими ставками только за контекст более 128 тысяч.
3. Требования к эффективности. xAI сообщает о примерно на 40% меньшем количестве «мыслительных» токенов при сопоставимой точности по сравнению с Grok-4, что позволяет снизить цену примерно на 98% для достижения производительности Grok-4 на фронтирных бенчмарках.
4. Профиль бенчмарка. Сообщается о pass@1: AIME-2025 — 92,0%, HMMT-2025 — 93,3%, GPQA-Diamond — 85,7%, LiveCodeBench (январь — май) — 80,0%.
5. Использование в агентских/поисковых задачах. После обучения с использованием инструментального RL; позиционируется для использования в браузерах и поисковых рабочих процессах с документированными показателями поисковых агентов и биллингом в реальном времени.
Резюме
Grok-4-Fast объединяет возможности уровня Grok-4 в единой модели с управляемыми подсказками, окном в 2 миллиона токенов, инструментальным RL и ценами, настроенными для высокопроизводительного поиска и агентских задач. Ранние сигналы от общественности (LMArena #1 в поиске, конкурентное размещение текста) соответствуют заявлению xAI о схожей точности при использовании примерно на 40% меньшего количества «мыслительных» токенов, что приводит к снижению задержки и стоимости единицы продукции.
1. Каковы основные особенности модели Grok-4-Fast и как они способствуют повышению производительности?
Основные особенности модели Grok-4-Fast включают:
* Унифицированная модель для логических и нелогических задач с единым весовым пространством.
* Контекст в 2 миллиона токенов, что позволяет обрабатывать большие объёмы информации.
* Обучение сквозным методом с использованием инструментального обучения с подкреплением (RL), которое решает, когда просматривать веб-страницы, выполнять код или вызывать инструменты.
* Снижение задержки и количества токенов за счёт объединения весов предыдущих версий Grok.
2. Какие показатели производительности демонстрирует Grok-4-Fast на различных бенчмарках?
На внутренних и публичных бенчмарках Grok-4-Fast демонстрирует результаты фронтирного класса. Примеры показателей производительности включают:
* BrowseComp — 44,9%;
* SimpleQA — 95,0%;
* Reka Research — 66,0%;
* китайские варианты (например, BrowseComp-zh) — 51,2%.
3. Как модель Grok-4-Fast влияет на стоимость использования по сравнению с предыдущей версией Grok-4?
Компания xAI утверждает, что Grok-4-Fast использует примерно на 40% меньше «мыслительных» токенов в среднем, при этом достигая сопоставимой точности. Это позволяет снизить цену примерно на 98% по сравнению с Grok-4 при использовании меньшего количества токенов и новых цен за токен.
4. Какие режимы и варианты развёртывания предлагает xAI для Grok-4-Fast?
Модель Grok-4-Fast доступна всем пользователям в режимах Grok Fast и Auto через веб и мобильные устройства. Режим Auto будет выбирать Grok-4-Fast для сложных запросов, чтобы улучшить задержку без потери качества. Для разработчиков xAI предлагает два SKU — grok-4-fast-reasoning и grok-4-fast-non-reasoning — оба с контекстом в 2 миллиона токенов.
5. Каковы цены на использование xAI API для Grok-4-Fast?
Цены на использование xAI API для Grok-4-Fast начинаются от $0,20/М за входные данные, $0,50/М за выходные данные, с кэшированными входными данными по $0,05/М и более высокими ставками только за контекст более 128 тысяч.