Простые модели могут превосходить глубокое обучение в прогнозировании климата

Учёные-экологи всё чаще используют огромные модели искусственного интеллекта для прогнозирования изменений погоды и климата. Однако новое исследование, проведённое учёными из Массачусетского технологического института (MIT), показывает, что более крупные модели не всегда лучше.

Команда демонстрирует, что в определённых климатических сценариях гораздо более простые, основанные на физических законах модели могут генерировать более точные прогнозы, чем современные модели глубокого обучения.

Их анализ также показывает, что метод бенчмаркинга, обычно используемый для оценки методов машинного обучения в климатических прогнозах, может быть искажён естественными вариациями данных, такими как колебания погодных условий. Это может привести к ошибочному выводу, что модель глубокого обучения делает более точные прогнозы, когда это не так.

Исследователи разработали более надёжный способ оценки этих методов, который показывает, что, хотя простые модели более точны при оценке региональных поверхностных температур, подходы глубокого обучения могут быть лучшим выбором для оценки локальных осадков.

Они использовали эти результаты для усовершенствования инструмента моделирования, известного как климатический эмулятор, который может быстро имитировать влияние деятельности человека на будущий климат.

Исследователи рассматривают свою работу как «предостерегающую историю» о рисках использования крупных моделей искусственного интеллекта в климатологии. Хотя модели глубокого обучения показали невероятный успех в таких областях, как обработка естественного языка, климатология содержит проверенный набор физических законов и приближений, и задача состоит в том, как включить их в модели искусственного интеллекта.

«Мы пытаемся разработать модели, которые будут полезны и актуальны для тех вещей, которые потребуются лицам, принимающим решения, в будущем при выборе климатической политики. Хотя может быть заманчиво использовать новейшую модель машинного обучения для решения климатической проблемы, это исследование показывает, что отступление назад и действительно размышления о фундаментальных основах проблемы важны и полезны», — говорит старший автор исследования Ноэль Селин, профессор Института данных, систем и общества MIT (IDSS) и факультета наук о Земле, атмосфере и планетах (EAPS).

Соавторами Селин являются ведущий автор Бьёрн Лютенс, бывший постдок EAPS, который сейчас является научным сотрудником IBM Research; старший автор Раффаэле Феррари, профессор океанографии Сесиль и Айда Грин в EAPS и директор программы MIT по атмосферам, океанам и климату; и Дункан Уотсон-Паррис, доцент Калифорнийского университета в Сан-Диего.

Селин и Феррари также являются соруководителями проекта «Внедрение вычислений в решение климатических задач», в рамках которого появилось это исследование. Статья опубликована сегодня в журнале Journal of Advances in Modeling Earth Systems.

Поскольку климат Земли настолько сложен, запуск современной климатической модели для прогнозирования того, как уровни загрязнения повлияют на такие факторы окружающей среды, как температура, может занять недели на самых мощных суперкомпьютерах мира.

Учёные часто создают климатические эмуляторы — более простые приближения современной климатической модели, которые работают быстрее и доступнее. Политик может использовать климатический эмулятор, чтобы увидеть, как альтернативные предположения о выбросах парниковых газов повлияют на будущие температуры, что поможет ему разработать нормативные акты.

Но эмулятор бесполезен, если он делает неточные прогнозы о локальных последствиях изменения климата. Хотя глубокое обучение становится всё более популярным для эмуляции, немногие исследования изучали, работают ли эти модели лучше, чем проверенные подходы.

Исследователи MIT провели такое исследование. Они сравнили традиционный метод, называемый линейным масштабированием закономерностей (LPS), с моделью глубокого обучения, используя общий контрольный набор данных для оценки климатических эмуляторов.

Их результаты показали, что LPS превзошёл модели глубокого обучения в прогнозировании почти всех параметров, которые они тестировали, включая температуру и осадки.

«Крупные методы искусственного интеллекта очень привлекательны для учёных, но они редко решают совершенно новую задачу, поэтому сначала необходимо реализовать существующее решение, чтобы выяснить, действительно ли сложный подход машинного обучения улучшает его», — говорит Лютенс.

Некоторые первоначальные результаты, казалось, противоречили знаниям исследователей в этой области. Мощная модель глубокого обучения должна была быть более точной при прогнозировании осадков, поскольку эти данные не следуют линейному шаблону.

Исследователи обнаружили, что большое количество естественных вариаций в климатических моделях может привести к тому, что модель глубокого обучения будет плохо работать с непредсказуемыми долгосрочными колебаниями, такими как Эль-Ниньо/Ла-Нинья. Это искажает результаты бенчмаркинга в пользу LPS, который усредняет эти колебания.

С учётом полученных данных исследователи создали новую систему оценки, учитывающую естественную изменчивость климата. С этой новой системой модель глубокого обучения показала немного лучшие результаты, чем LPS, для локальных осадков, но LPS по-прежнему был более точен для прогнозирования температуры.

«Важно использовать тот инструмент моделирования, который подходит для решения задачи, но для этого нужно сначала правильно поставить задачу», — говорит Селин.

Основываясь на этих результатах, исследователи включили LPS в платформу климатической эмуляции для прогнозирования локальных изменений температуры в различных сценариях выбросов.

«Мы не утверждаем, что LPS всегда должен быть целью. У него всё ещё есть ограничения. Например, LPS не прогнозирует изменчивость или экстремальные погодные явления», — добавляет Феррари.

Вместо этого они надеются, что их результаты подчеркнут необходимость разработки более совершенных методов бенчмаркинга, которые могли бы дать более полную картину того, какой метод климатической эмуляции лучше всего подходит для конкретной ситуации.

«С улучшенным эталоном климатической эмуляции мы могли бы использовать более сложные методы машинного обучения для изучения проблем, которые в настоящее время очень трудно решить, например, воздействие аэрозолей или оценки экстремальных осадков», — говорит Лютенс.

В конечном счёте, более точные методы бенчмаркинга помогут гарантировать, что политики будут принимать решения на основе наилучшей доступной информации.

Исследователи надеются, что другие учёные продолжат их анализ, возможно, изучая дополнительные улучшения методов климатической эмуляции и эталонов. Такие исследования могут изучить ориентированные на воздействие показатели, такие как индикаторы засухи и риски лесных пожаров, или новые переменные, такие как региональные скорости ветра.

Предоставлено Massachusetts Institute of Technology (MIT)

Источник