xAI запускает Grok-4-Fast: унифицированная модель для логических и нелогических задач с контекстом в 2 миллиона токенов

Компания xAI представила Grok-4-Fast — оптимизированный по стоимости преемник Grok-4, который объединяет «логическое» и «нелогическое» поведение в едином наборе весовых коэффициентов, управляемом через системные подсказки. Модель предназначена для высокопроизводительного поиска, кодирования и ответов на вопросы.

Особенности модели

Контекст: модель имеет окно контекста в 2 миллиона токенов.

Обучение: Grok-4-Fast обучен сквозным методом с использованием инструментального обучения с подкреплением (RL), который решает, когда просматривать веб-страницы, выполнять код или вызывать инструменты.

Архитектура: предыдущие версии Grok разделяли «логические» и «нелогические» ответы на длинные и короткие цепочки. Grok-4-Fast объединяет эти веса, что снижает задержку и количество токенов.

Применение в поиске и агентских задачах

Grok-4-Fast был обучен сквозным методом с использованием инструментального обучения с подкреплением и показывает прирост по бенчмаркам, ориентированным на поиск:

BrowseComp — 44,9%;

SimpleQA — 95,0%;

Reka Research — 66,0%;

китайские варианты (например, BrowseComp-zh) — 51,2%.

xAI также приводит данные частных боевых испытаний на LMArena, где Grok-4-Fast-search (кодовое имя «menlo») занимает первое место в Search Arena с 1163 Elo, а текстовый вариант (кодовое имя «tahoe») занимает восьмое место в Text Arena, примерно наравне с Grok-4-0709.

Показатели производительности и эффективности

На внутренних и публичных бенчмарках Grok-4-Fast демонстрирует результаты фронтирного класса, сокращая при этом использование токенов. xAI сообщает о результатах pass@1:

AIME 2025 (без инструментов) — 92,0%;

HMMT 2025 (без инструментов) — 93,3%;

GPQA Diamond — 85,7%;

LiveCodeBench (январь — май) — 80,0%.

Компания утверждает, что модель использует примерно на 40% меньше «мыслительных» токенов в среднем, при этом достигая сопоставимой точности. Это позволяет снизить цену на ~98% по сравнению с Grok-4 при использовании меньшего количества токенов и новых цен за токен.

Развёртывание и цена

Модель доступна всем пользователям в режимах Grok Fast и Auto через веб и мобильные устройства. Режим Auto будет выбирать Grok-4-Fast для сложных запросов, чтобы улучшить задержку без потери качества. Впервые бесплатные пользователи получают доступ к последнему уровню моделей xAI.

Для разработчиков xAI предлагает два SKU — grok-4-fast-reasoning и grok-4-fast-non-reasoning — оба с контекстом в 2 миллиона токенов.

Цены (xAI API):

$0,20 / 1 миллион входных токенов (менее 128 тысяч);

$0,40 / 1 миллион входных токенов (128 тысяч и более);

$0,50 / 1 миллион выходных токенов (менее 128 тысяч);

$1,00 / 1 миллион выходных токенов (128 тысяч и более);

$0,05 / 1 миллион кэшированных входных токенов.

Технические выводы:

1. Унифицированная модель + контекст в 2 миллиона токенов. Grok-4-Fast использует единое весовое пространство для «логического» и «нелогического» поведения, управляемое через подсказки, с окном в 2 миллиона токенов для обоих SKU.
2. Цены для масштабирования. Цены API начинаются от $0,20/М за входные данные, $0,50/М за выходные данные, с кэшированными входными данными по $0,05/М и более высокими ставками только за контекст более 128 тысяч.
3. Требования к эффективности. xAI сообщает о примерно на 40% меньшем количестве «мыслительных» токенов при сопоставимой точности по сравнению с Grok-4, что позволяет снизить цену примерно на 98% для достижения производительности Grok-4 на фронтирных бенчмарках.
4. Профиль бенчмарка. Сообщается о pass@1: AIME-2025 — 92,0%, HMMT-2025 — 93,3%, GPQA-Diamond — 85,7%, LiveCodeBench (январь — май) — 80,0%.
5. Использование в агентских/поисковых задачах. После обучения с использованием инструментального RL; позиционируется для использования в браузерах и поисковых рабочих процессах с документированными показателями поисковых агентов и биллингом в реальном времени.

Резюме

Grok-4-Fast объединяет возможности уровня Grok-4 в единой модели с управляемыми подсказками, окном в 2 миллиона токенов, инструментальным RL и ценами, настроенными для высокопроизводительного поиска и агентских задач. Ранние сигналы от общественности (LMArena #1 в поиске, конкурентное размещение текста) соответствуют заявлению xAI о схожей точности при использовании примерно на 40% меньшего количества «мыслительных» токенов, что приводит к снижению задержки и стоимости единицы продукции.

1. Каковы основные особенности модели Grok-4-Fast и как они способствуют повышению производительности?

Основные особенности модели Grok-4-Fast включают:
* Унифицированная модель для логических и нелогических задач с единым весовым пространством.
* Контекст в 2 миллиона токенов, что позволяет обрабатывать большие объёмы информации.
* Обучение сквозным методом с использованием инструментального обучения с подкреплением (RL), которое решает, когда просматривать веб-страницы, выполнять код или вызывать инструменты.
* Снижение задержки и количества токенов за счёт объединения весов предыдущих версий Grok.

2. Какие показатели производительности демонстрирует Grok-4-Fast на различных бенчмарках?

На внутренних и публичных бенчмарках Grok-4-Fast демонстрирует результаты фронтирного класса. Примеры показателей производительности включают:
* BrowseComp — 44,9%;
* SimpleQA — 95,0%;
* Reka Research — 66,0%;
* китайские варианты (например, BrowseComp-zh) — 51,2%.

3. Как модель Grok-4-Fast влияет на стоимость использования по сравнению с предыдущей версией Grok-4?

Компания xAI утверждает, что Grok-4-Fast использует примерно на 40% меньше «мыслительных» токенов в среднем, при этом достигая сопоставимой точности. Это позволяет снизить цену примерно на 98% по сравнению с Grok-4 при использовании меньшего количества токенов и новых цен за токен.

4. Какие режимы и варианты развёртывания предлагает xAI для Grok-4-Fast?

Модель Grok-4-Fast доступна всем пользователям в режимах Grok Fast и Auto через веб и мобильные устройства. Режим Auto будет выбирать Grok-4-Fast для сложных запросов, чтобы улучшить задержку без потери качества. Для разработчиков xAI предлагает два SKU — grok-4-fast-reasoning и grok-4-fast-non-reasoning — оба с контекстом в 2 миллиона токенов.

5. Каковы цены на использование xAI API для Grok-4-Fast?

Цены на использование xAI API для Grok-4-Fast начинаются от $0,20/М за входные данные, $0,50/М за выходные данные, с кэшированными входными данными по $0,05/М и более высокими ставками только за контекст более 128 тысяч.

Источник