Генеративный искусственный интеллект для количественной оценки неопределённости в прогнозировании погоды

Автор: Лизао (Ларри) Ли, инженер-программист, и Роб Карвер, научный сотрудник, Google Research

Точные прогнозы погоды могут напрямую влиять на жизнь людей: от помощи в принятии повседневных решений, например, что взять с собой на прогулку, до информирования о срочных действиях, например, защиты людей в опасных погодных условиях. Значение точных и своевременных прогнозов погоды будет только возрастать по мере изменения климата. Осознавая это, мы в Google инвестируем в исследования погоды и климата, чтобы обеспечить соответствие технологий прогнозирования будущего спроса на надёжную информацию о погоде.

Среди наших последних инноваций — MetNet-3, прогнозы Google с высоким разрешением на срок до 24 часов в будущем, и GraphCast, модель погоды, которая может прогнозировать погоду на срок до 10 дней вперёд.

Погода по своей природе стохастична

Чтобы количественно оценить неопределённость, традиционные методы основаны на физическом моделировании для генерации ансамбля прогнозов. Однако создание большого ансамбля для точного выявления и характеристики редких и экстремальных погодных явлений требует значительных вычислительных ресурсов.

Учитывая это, мы рады объявить о нашей последней инновации, призванной ускорить прогресс в области прогнозирования погоды — Scalable Ensemble Envelope Diffusion Sampler (SEEDS), недавно опубликованной в Science Advances. SEEDS — это генеративная модель искусственного интеллекта, которая может эффективно генерировать ансамбли прогнозов погоды в масштабе при незначительной части затрат традиционных физических моделей прогнозирования.

Эта технология открывает новые возможности для науки о погоде и климате и представляет одно из первых применений вероятностных диффузионных моделей в прогнозировании погоды и климата.

Необходимость вероятностных прогнозов: эффект бабочки

На встрече Американской ассоциации содействия развитию науки в Вашингтоне, округ Колумбия, профессор метеорологии Массачусетского технологического института Эд Лоренц выступил с докладом под названием «Взмах крыльев бабочки в Бразилии вызывает торнадо в Техасе?», который способствовал появлению термина «эффект бабочки». Он опирался на свою более раннюю эпохальную статью 1963 года, где он исследовал возможность «долгосрочного прогнозирования погоды» и описал, как ошибки в начальных условиях экспоненциально растут при интегрировании во времени с помощью численных моделей прогнозирования погоды.

Этот экспоненциальный рост ошибок, известный как хаос, приводит к детерминированному пределу предсказуемости, который ограничивает использование индивидуальных прогнозов при принятии решений, поскольку они не учитывают неопределённость погодных условий. Это особенно проблематично при прогнозировании экстремальных погодных явлений, таких как ураганы, волны тепла или наводнения.

Признавая ограничения детерминированных прогнозов, метеорологические агентства по всему миру выдают вероятностные прогнозы. Такие прогнозы основаны на ансамблях детерминированных прогнозов, каждый из которых генерируется путём включения синтетического шума в начальные условия и стохастичности в физических процессах.

Используя быстрые темпы роста ошибок в погодных моделях, прогнозы в ансамбле намеренно различаются: начальные неопределённости настраиваются так, чтобы генерировать как можно более отличающиеся прогоны, а стохастические процессы в модели погоды вносят дополнительные различия во время модельного прогона. Рост ошибок смягчается путём усреднения всех прогнозов в ансамбле, а изменчивость в ансамбле прогнозов количественно определяет неопределённость погодных условий.

Хотя это эффективно, создание таких вероятностных прогнозов требует значительных вычислительных затрат. Они требуют запуска сложных численных моделей погоды на массивных суперкомпьютерах многократно. Следовательно, многие оперативные прогнозы погоды могут позволить себе генерировать только ~10–50 членов ансамбля для каждого цикла прогноза.

SEEDS: достижения с использованием искусственного интеллекта

В статье представлена технология Scalable Ensemble Envelope Diffusion Sampler (SEEDS), генеративная модель искусственного интеллекта для генерации ансамблей прогнозов погоды. SEEDS основана на вероятностных моделях шумоподавления, передовом методе генеративного искусственного интеллекта, впервые разработанном частично в Google Research.

SEEDS может генерировать большой ансамбль, основанный всего на одном или двух прогнозах из действующей системы численного прогнозирования погоды. Созданные ансамбли не только дают правдоподобные прогнозы погоды, но и соответствуют или превосходят физические ансамбли по таким показателям мастерства, как ранговая гистограмма, среднеквадратичная ошибка (RMSE) и непрерывная оценка вероятностей (CRPS).

Генерация правдоподобных прогнозов погоды

Для сравнения мы используем глобальную систему ансамблевого прогнозирования (GEFS) для конкретной даты во время европейской жары 2022 года. Мы также сравниваем результаты с прогнозами из гауссовой модели, которая предсказывает одномерное среднее значение и стандартное отклонение каждого атмосферного поля в каждом месте, распространённый и вычислительно эффективный, но менее сложный подход, основанный на данных.

Поскольку SEEDS напрямую моделирует совместное распределение состояния атмосферы, она реалистично отражает как пространственную ковариацию, так и корреляцию между геопотенциалом средней тропосферы и средним уровнем давления на уровне моря, которые тесно связаны и обычно используются метеорологами для оценки и проверки прогнозов.

Градиенты среднего уровня давления на уровне моря — это то, что приводит в движение ветры на поверхности, а градиенты в геопотенциале средней тропосферы создают ветры на верхнем уровне, которые перемещают крупномасштабные погодные явления.

Сгенерированные образцы из SEEDS, показанные на рисунке ниже (кадры Ca–Ch), демонстрируют геопотенциальную впадину к западу от Португалии со структурой, аналогичной той, что обнаружена в оперативных прогнозах США или в реанализе, основанном на наблюдениях.

Хотя гауссова модель адекватно предсказывает маргинальные одномерные распределения, она не может уловить межполевые или пространственные корреляции. Это затрудняет оценку воздействия, которое эти аномалии могут оказать на проникновение горячего воздуха из Северной Африки, что может усугубить волны тепла в Европе.

Охват экстремальных явлений более точно

SEEDS обеспечивает более точный статистический охват экстремального теплового явления в Европе 2022/07/14, обозначенного коричневой звездой. Каждый график показывает значения общего столбца интегрированного водяного пара (TCVW) по сравнению с температурой в узле сетки вблизи Лиссабона, Португалия, на основе 16 384 образцов, сгенерированных нашими моделями, показанных в виде зелёных точек, обусловленных двумя семенами (синие квадраты), взятыми из 7-дневных оперативных ансамблевых прогнозов США (обозначены более редкими коричневыми треугольниками).

Заключение и перспективы на будущее

Благодарности: все авторы SEEDS, Лизао Ли, Роб Карвер, Игнасио Лопес-Гомес, Фэй Ша и Джон Андерсон, стали соавторами этого блога, а Карла Бромберг — руководителем программы. Мы также благодарим Тома Смолла, который разработал анимацию. Наши коллеги из Google Research предоставили бесценные советы по работе над SEEDS. Среди них мы благодарим Леонардо Зепеда-Нуньеса, Чжун И Вана, Стефана Распа, Стефана Хойера и Тапио Шнайдера за их вклад и полезные обсуждения. Мы благодарим Тайлера Рассела за дополнительное техническое управление программой, а также Алекса Мероуза за координацию данных и поддержку. Мы также благодарим Ценк Газен, Шрею Агравал и Джейсона Хикки за обсуждения на раннем этапе работы над SEEDS.

Источник

Оставьте комментарий