### Точный прогноз погоды может спасти жизни
Точные прогнозы погоды напрямую влияют на жизнь людей: помогают принимать повседневные решения, например, что взять с собой на прогулку, и подсказывают, как действовать в экстренных ситуациях, например, как защитить людей от опасных погодных условий. Важность точных и своевременных прогнозов погоды будет только расти по мере изменения климата.
В Google осознают это и инвестируют в исследования погоды и климата, чтобы гарантировать, что технологии прогнозирования завтрашнего дня смогут удовлетворить спрос на надёжную информацию о погоде. Некоторые из наших недавних инноваций включают MetNet-3 — прогнозы высокого разрешения на 24 часа вперёд, и GraphCast — модель погоды, которая может предсказывать погоду на 10 дней вперёд.
### Погода как стохастический процесс
Погоду можно назвать стохастическим процессом. Чтобы количественно оценить неопределённость, традиционные методы полагаются на физическое моделирование для генерации ансамбля прогнозов. Однако создание большого ансамбля требует значительных вычислительных ресурсов, что затрудняет точное определение редких и экстремальных погодных явлений.
Мы рады представить наше последнее достижение, направленное на ускорение прогресса в области прогнозирования погоды — Scalable Ensemble Envelope Diffusion Sampler (SEEDS), недавно опубликованное в журнале Science Advances. SEEDS — это генеративная модель искусственного интеллекта, которая может эффективно создавать ансамбли прогнозов погоды в больших масштабах и при этом требует гораздо меньше затрат, чем традиционные модели прогнозирования, основанные на физических процессах. Эта технология открывает новые возможности для метеорологии и климатологии и представляет собой одно из первых применений вероятностных диффузионных моделей в прогнозировании погоды и климата.
### Необходимость вероятностных прогнозов: эффект бабочки
На собрании Американской ассоциации содействия развитию науки в Вашингтоне, округ Колумбия, профессор метеорологии Массачусетского технологического института Эд Лоренц выступил с докладом «Вызывает ли взмах крыльев бабочки в Бразилии торнадо в Техасе?», который способствовал появлению термина «эффект бабочки». Он опирался на свою более раннюю, знаковую статью 1963 года, где рассматривал возможность «очень долгосрочного прогнозирования погоды» и описывал, как ошибки в начальных условиях экспоненциально растут при интегрировании во времени с моделями численного прогноза погоды. Этот экспоненциальный рост ошибок, известный как хаос, приводит к детерминированному пределу предсказуемости, который ограничивает использование отдельных прогнозов при принятии решений, поскольку они не учитывают неотъемлемую неопределённость погодных условий. Это особенно проблематично при прогнозировании экстремальных погодных явлений, таких как ураганы, жара или наводнения.
Признавая ограничения детерминированных прогнозов, метеорологические службы по всему миру публикуют вероятностные прогнозы. Такие прогнозы основаны на ансамблях детерминированных прогнозов, каждый из которых генерируется путём включения синтетического шума в начальные условия и стохастичности в физические процессы. Используя быстрый темп роста ошибок в моделях погоды, прогнозы в ансамбле намеренно различаются: начальные неопределённости настраиваются так, чтобы результаты были как можно более разными, а стохастические процессы в модели погоды вносят дополнительные различия во время моделирования. Рост ошибок смягчается путём усреднения всех прогнозов в ансамбле, а вариативность в ансамбле прогнозов количественно определяет неопределённость погодных условий.
Хотя это и эффективно, создание таких вероятностных прогнозов требует значительных вычислительных ресурсов. Для этого необходимо многократно запускать сложные численные модели погоды на огромных суперкомпьютерах. Следовательно, многие оперативные прогнозы погоды могут позволить себе создать только около 10–50 членов ансамбля для каждого цикла прогноза. Это проблема для пользователей, обеспокоенных вероятностью редких, но значимых погодных явлений, которые обычно требуют гораздо больших ансамблей для оценки за пределами нескольких дней. Например, для прогнозирования вероятности событий с вероятностью возникновения 1% с относительной ошибкой менее 10% потребуется ансамбль из 10 000 участников. Оценка вероятности таких экстремальных явлений может быть полезна, например, для подготовки к чрезвычайным ситуациям или для торговцев энергией.
### SEEDS: достижения с помощью ИИ
В нашей статье мы представляем Scalable Ensemble Envelope Diffusion Sampler (SEEDS) — технологию генеративного искусственного интеллекта для создания ансамблей прогнозов погоды. SEEDS основан на вероятностных моделях диффузии с шумоподавлением, передовом методе генеративного ИИ, разработанном частично в Google Research.
SEEDS может создать большой ансамбль, опираясь всего на один или два прогноза из действующей системы численного прогнозирования погоды. Полученные ансамбли не только дают правдоподобные прогнозы, похожие на реальную погоду, но также соответствуют или превосходят ансамбли, основанные на физических процессах, по таким показателям мастерства, как ранжированный гистограмма, среднеквадратичная ошибка (RMSE) и непрерывный ранжированный вероятностный балл (CRPS). В частности, сгенерированные ансамбли более точно оценивают вероятности для хвоста распределения прогнозов, например, для погодных явлений ±2σ и ±3σ. Самое главное, что вычислительные затраты на модель незначительны по сравнению с часами вычислительного времени, необходимого суперкомпьютерам для составления прогноза. Модель имеет пропускную способность 256 участников ансамбля (с разрешением 2°) за 3 минуты на экземплярах Google Cloud TPUv3-32 и может легко масштабироваться для повышения пропускной способности при развёртывании дополнительных ускорителей.
### Генерация правдоподобных прогнозов погоды
Мы сравниваем прогнозы, полученные с помощью SEEDS, с оперативными прогнозами из Глобальной системы ансамблевого прогноза (Global Ensemble Forecast System, GEFS) на определённую дату во время европейской жары 2022 года. Мы также сравниваем результаты с прогнозами гауссовой модели, которая предсказывает одномерное среднее значение и стандартное отклонение каждого атмосферного поля в каждом месте — распространённый и вычислительно эффективный, но менее изощрённый подход, управляемый данными. Гауссова модель предназначена для описания выходных данных поэлементной постобработки, которая игнорирует корреляции и рассматривает каждую точку сетки как независимую случайную величину. В отличие от этого, настоящая погодная карта имела бы подробные корреляционные структуры.
Поскольку SEEDS напрямую моделирует совместное распределение состояния атмосферы, он реалистично отражает как пространственную ковариацию, так и корреляцию между геопотенциалом средней тропосферы и средним уровнем давления моря, которые тесно связаны и обычно используются метеорологами для оценки и проверки прогнозов. Градиенты среднего уровня давления моря определяют направление ветра у поверхности, а градиенты геопотенциала средней тропосферы создают ветры на больших высотах, которые перемещают крупномасштабные погодные системы.
Сгенерированные с помощью SEEDS образцы, представленные на рисунке ниже (кадры Ca–Ch), отображают геопотенциальный жёлоб к западу от Португалии со структурой пространства, аналогичной той, которая обнаружена в оперативных прогнозах США или в реанализе, основанном на наблюдениях. Хотя гауссова модель адекватно предсказывает маргинальные одномерные распределения, она не может уловить межполевые или пространственные корреляции. Это затрудняет оценку эффектов, которые эти аномалии могут оказать на вторжение горячего воздуха из Северной Африки, которое может усилить жару над Европой.
### Более точное покрытие экстремальных явлений
SEEDS обеспечивает лучшее статистическое покрытие экстремального явления жары в Европе 14 июля 2022 года, обозначенного коричневой звездой. Каждый график показывает значения общего интегрированного по колонке водяного пара (TCVW) в зависимости от температуры в точке сетки недалеко от Лиссабона, Португалия, на основе 16 384 образцов, сгенерированных нашими моделями, представленных зелёными точками и обусловленных двумя начальными данными (синие квадраты), взятыми из семидневных оперативных ансамблевых прогнозов США (обозначены более редкими коричневыми треугольниками). Действительное время прогноза — 1:00 по местному времени. Сплошные уровни контуров соответствуют изопропорциям ядерной плотности SEEDS, причём самый внешний охватывает 95% массы, а между каждым уровнем — 11,875%.
### Заключение и будущие перспективы
Авторы SEEDS: Лизао Ли, Роб Карвер, Игнасио Лопес-Гомез, Фэй Ша и Джон Андерсон — являются соавторами этого поста в блоге, а Карла Бромберг — руководителем программы. Мы также благодарим Тома Смолла за разработку анимации. Наши коллеги из Google Research дали ценные советы по работе с SEEDS. Среди них мы благодарим Леонардо Зепеда-Нуньеса, Чжун И Вана, Стефана Распа, Стефана Хойера и Тапио Шнайдера за их вклад и полезные обсуждения. Мы благодарим Тайлера Рассела за дополнительное техническое управление программой, а также Алекса Мероуза за координацию данных и поддержку. Мы также благодарим Ценка Газена, Шрею Агравал и Джейсона Хикки за обсуждения на раннем этапе работы над SEEDS.
Добавить комментарий