Salesforce выпускает Moirai 2.0: новейшая модель для работы с временными рядами

Исследователи из Salesforce AI представили Moirai 2.0 — последний шаг вперёд в области моделей для работы с временными рядами. Модель построена на архитектуре декодер-только (decoder-only transformer), что устанавливает новый стандарт производительности и эффективности. Она заняла первое место в бенчмарке GIFT-Eval — золотом стандарте для оценки моделей прогнозирования временных рядов.

Что делает Moirai 2.0 особенной?

Инновации в архитектуре:
* Декодер-только трансформер: переход от маскированного энкодера к декодер-только трансформеру позволяет Moirai 2.0 лучше моделировать генерацию авторегрессионных прогнозов, повышая масштабируемость и производительность на больших и сложных наборах данных.
* Эффективное многомаркерное прогнозирование: модель прогнозирует несколько маркеров одновременно, что повышает эффективность и стабильность прогнозирования.
* Расширенная фильтрация данных: низкокачественные временные ряды, не поддающиеся прогнозированию, автоматически исключаются во время обучения, повышая надёжность.
* Встраивание патчей и случайная маскировка: новые методы кодирования информации о пропущенных значениях и устойчивости к неполным данным во время прогнозирования.

Расширенный набор данных для предварительного обучения:
* Реальные наборы данных, такие как GIFT-Eval Pretrain и Train.
* Смешивание синтетических временных рядов для повышения разнообразия.
* Процедуры KernelSynth из исследований Chronos.
* Внутренние операционные данные из ИТ-систем Salesforce.

Производительность:
* Лучший показатель MASE на GIFT-Eval для моделей без утечки данных (принятая в отрасли метрика точности прогнозов).
* Производительность CRPS соответствует предыдущему уровню.
* По сравнению с Moirai_large: на 16% лучше по MASE, на 13% лучше по CRPS, на 44% быстрее в выводе, на 96% меньше размер параметров.

Почему Moirai 2.0 важна для практиков:
* ИТ-операции: проактивное масштабирование мощностей, обнаружение аномалий.
* Прогнозирование продаж: точные, масштабируемые прогнозы доходов.
* Планирование спроса: оптимизированное управление запасами.
* Планирование цепочки поставок: улучшение планирования, сокращение отходов.
* И многие другие бизнес-процессы, основанные на данных.

С значительно уменьшенным размером модели и улучшенной скоростью высококачественное прогнозирование теперь может применяться в масштабе, что позволяет предприятиям принимать более разумные и быстрые решения независимо от их инфраструктуры данных.

Начало работы: Moirai 2.0 на практике

Интеграция проста для разработчиков и специалистов по данным. Вот типичный рабочий процесс с использованием открытых модулей, доступных на Hugging Face:

Пример Python Workflow:

“`python
import matplotlib.pyplot as plt
from gluonts.dataset.repository import dataset_recipes
from uni2ts.evalutil.data import getgluontstestdataset
from uni2ts.model.moirai2 import Moirai2Forecast, Moirai2Module
“`

Загрузка Moirai 2.0:

“`python
model = Moirai2Forecast(
module=Moirai2Module.from_pretrained(“Salesforce/moirai-2.0-R-small”),
prediction_length=100,
context_length=1680,
target_dim=1,
featdynamicreal_dim=0,
pastfeatdynamicrealdim=0
)
“`

Загрузка набора данных и генерация прогнозов:

“`python
testdata, metadata = getgluontstestdataset(“electricity”, prediction_length=None, regenerate=False)
predictor = model.createpredictor(batchsize=32)
forecasts = predictor.predict(test_data.input)
“`

Визуализация результатов:

“`python

Пример визуализации

fig, axes = plt.subplots(nrows=2, ncols=3, figsize=(25, 10))

Используйте утилиту Moirai для отображения прогнозов

“`

Полные примеры и ссылки на блокноты предоставлены Salesforce для более глубокого экспериментирования.

Универсальность, масштабируемость, надёжность

Демократизация доступа к передовым технологиям прогнозирования общего назначения делает Moirai 2.0 способной изменить ландшафт моделирования временных рядов. Благодаря гибкости в различных областях, повышенной надёжности, более быстрому выводу и меньшим вычислительным требованиям модель Salesforce AI Research открывает путь для бизнеса и исследователей по всему миру для использования возможностей прогнозирования для принятия преобразующих решений.

1. Какие инновационные архитектурные решения были применены в модели Moirai 2.0 для улучшения прогнозирования временных рядов?

В модели Moirai 2.0 применены следующие инновационные архитектурные решения:
* использование декодер-только трансформера вместо маскированного энкодера;
* многомаркерное прогнозирование для повышения эффективности и стабильности;
* расширенная фильтрация данных для исключения низкокачественных временных рядов;
* встраивание патчей и случайная маскировка для устойчивости к неполным данным.

2. Какие преимущества предлагает Moirai 2.0 по сравнению с предыдущими моделями?

Moirai 2.0 предлагает следующие преимущества:
* лучший показатель MASE на GIFT-Eval для моделей без утечки данных;
* производительность CRPS на уровне предыдущих моделей;
* на 16% лучше по MASE, на 13% лучше по CRPS по сравнению с Moirai_large;
* на 44% быстрее в выводе;
* на 96% меньше размер параметров по сравнению с Moirai_large.

3. Какие бизнес-процессы могут быть улучшены с помощью Moirai 2.0?

Moirai 2.0 может быть использована для улучшения следующих бизнес-процессов:
* ИТ-операции (проактивное масштабирование мощностей, обнаружение аномалий);
* прогнозирование продаж (точные, масштабируемые прогнозы доходов);
* планирование спроса (оптимизированное управление запасами);
* планирование цепочки поставок (улучшение планирования, сокращение отходов).

4. Какие шаги включает в себя типичный рабочий процесс с использованием Moirai 2.0 на практике?

Типичный рабочий процесс с использованием Moirai 2.0 включает в себя следующие шаги:
* загрузка Moirai 2.0;
* загрузка набора данных и генерация прогнозов;
* визуализация результатов.

5. Какие возможности предоставляет Moirai 2.0 для бизнеса и исследователей?

Moirai 2.0 предоставляет следующие возможности:
* демократизация доступа к передовым технологиям прогнозирования;
* гибкость в различных областях;
* повышенная надёжность;
* более быстрый вывод;
* меньшие вычислительные требования.

Источник