Учёные-экологи всё чаще используют огромные модели искусственного интеллекта для прогнозирования изменений погоды и климата. Однако новое исследование, проведённое учёными из Массачусетского технологического института (MIT), показывает, что большие модели не всегда лучше.
Команда демонстрирует, что в некоторых климатических сценариях гораздо более простые, основанные на физике модели могут генерировать более точные прогнозы, чем современные модели глубокого обучения.
Их анализ также показывает, что метод бенчмаркинга, обычно используемый для оценки методов машинного обучения в прогнозировании климата, может быть искажён естественными вариациями данных, такими как колебания погодных условий. Это может привести к тому, что кто-то поверит, что модель глубокого обучения делает более точные прогнозы, когда это не так.
Исследователи разработали более надёжный способ оценки этих методов, который показывает, что, хотя простые модели более точны при оценке региональных поверхностных температур, подходы глубокого обучения могут быть лучшим выбором для оценки локальных осадков.
Они использовали эти результаты для усовершенствования инструмента моделирования, известного как климатический эмулятор, который может быстро имитировать влияние деятельности человека на будущий климат.
Исследователи рассматривают свою работу как «предостережение» о рисках использования крупных моделей искусственного интеллекта в климатологии. Хотя модели глубокого обучения показали невероятный успех в таких областях, как обработка естественного языка, климатология содержит проверенный набор физических законов и приближений, и задача состоит в том, как включить их в модели искусственного интеллекта.
«Мы пытаемся разработать модели, которые будут полезны и актуальны для тех вещей, которые потребуются лицам, принимающим решения, в будущем при выборе климатической политики. Хотя может быть заманчиво использовать новейшую модель машинного обучения для решения климатической проблемы, это исследование показывает, что важно и полезно отступить и действительно задуматься об основах проблемы», — говорит старший автор исследования Ноэль Селин, профессор Института данных, систем и общества MIT (IDSS) и Департамента наук о Земле, атмосфере и планетах (EAPS).
Соавторами Селин являются ведущий автор Бьёрн Лютенс, бывший постдок EAPS, который сейчас является научным сотрудником IBM Research; старший автор Раффаэле Феррари, профессор океанографии в Cecil and Ida Green в EAPS и директор программы MIT «Атмосферы, океаны и климат»; и Дункан Уотсон-Паррис, доцент Калифорнийского университета в Сан-Диего. Селин и Феррари также являются соруководителями проекта Bringing Computation to the Climate Challenge, в рамках которого проводилось это исследование. Статья опубликована сегодня в Journal of Advances in Modeling Earth Systems.
Сравнение эмуляторов
Поскольку климат Земли настолько сложен, запуск современной климатической модели для прогнозирования того, как уровни загрязнения повлияют на такие факторы окружающей среды, как температура, может занять недели на самых мощных суперкомпьютерах мира.
Учёные часто создают климатические эмуляторы — более простые приближения к современной климатической модели, которые работают быстрее и доступнее. Политик может использовать климатический эмулятор, чтобы увидеть, как альтернативные предположения о выбросах парниковых газов повлияют на будущие температуры, что поможет ему разработать нормативные акты.
Но эмулятор бесполезен, если он делает неточные прогнозы о локальных последствиях изменения климата. Хотя глубокое обучение становится всё более популярным для эмуляции, немногие исследования изучали, работают ли эти модели лучше, чем проверенные подходы.
Исследователи MIT провели такое исследование. Они сравнили традиционный метод, называемый линейным масштабированием закономерностей (LPS), с моделью глубокого обучения, используя общий контрольный набор данных для оценки климатических эмуляторов.
Их результаты показали, что LPS превосходит модели глубокого обучения в прогнозировании почти всех параметров, которые они тестировали, включая температуру и осадки.
«Методы искусственного интеллекта большого размера очень привлекательны для учёных, но они редко решают совершенно новую задачу, поэтому сначала необходимо реализовать существующее решение, чтобы выяснить, действительно ли сложный подход машинного обучения улучшает его», — говорит Лютенс.
Некоторые первоначальные результаты, казалось, противоречили знаниям исследователей в этой области. Мощная модель глубокого обучения должна была быть более точной при прогнозировании осадков, поскольку эти данные не следуют линейному шаблону.
Исследователи обнаружили, что большое количество естественных вариаций в климатических моделях может привести к тому, что модель глубокого обучения будет работать плохо при прогнозировании непредсказуемых долгосрочных колебаний, таких как Эль-Ниньо/Ла-Нинья. Это искажает результаты бенчмаркинга в пользу LPS, который усредняет эти колебания.
Создание новой оценки
Затем исследователи создали новую оценку с большим количеством данных, учитывающих естественную изменчивость климата. С этой новой оценкой модель глубокого обучения показала себя немного лучше, чем LPS, для локальных осадков, но LPS всё ещё был более точным для прогнозов температуры.
«Важно использовать тот инструмент моделирования, который подходит для решения задачи, но для этого нужно сначала правильно поставить задачу», — говорит Селин.
Основываясь на этих результатах, исследователи включили LPS в платформу климатического эмулирования для прогнозирования локальных изменений температуры в различных сценариях выбросов.
«Мы не выступаем за то, чтобы LPS всегда была целью. У неё всё ещё есть ограничения. Например, LPS не прогнозирует изменчивость или экстремальные погодные явления», — добавляет Феррари.
Они надеются, что их результаты подчеркнут необходимость разработки более совершенных методов бенчмаркинга, которые могли бы дать более полную картину того, какой метод климатического эмулирования лучше всего подходит для конкретной ситуации.
«С улучшенным эталоном климатического эмулирования мы могли бы использовать более сложные методы машинного обучения для изучения проблем, которые в настоящее время очень трудно решить, например, воздействие аэрозолей или оценки экстремальных осадков», — говорит Лютенс.
В конечном счёте, более точные методы бенчмаркинга помогут обеспечить принятие политиками решений на основе наилучшей доступной информации.
Исследователи надеются, что другие учёные продолжат их анализ, возможно, изучая дополнительные улучшения методов климатического эмулирования и эталонов. Такие исследования могли бы изучить ориентированные на воздействие показатели, такие как индикаторы засухи и риски лесных пожаров, или новые переменные, такие как региональные скорости ветра.
Это исследование частично финансировалось компанией Schmidt Sciences, LLC, и является частью команды MIT Climate Grand Challenges для проекта «Bringing Computation to the Climate Challenge».
1. Какие выводы можно сделать из сравнения традиционных методов и моделей глубокого обучения в прогнозировании климата?
Из текста следует, что традиционные методы, такие как линейное масштабирование закономерностей (LPS), могут превосходить модели глубокого обучения в прогнозировании климатических параметров, включая температуру и осадки. Это подчёркивает важность тщательного сравнения и выбора наиболее подходящего метода для конкретной задачи.
2. Какие проблемы могут возникнуть при использовании моделей глубокого обучения для прогнозирования климата?
Модели глубокого обучения могут работать плохо при прогнозировании непредсказуемых долгосрочных колебаний, таких как Эль-Ниньо/Ла-Нинья, из-за большого количества естественных вариаций в климатических моделях. Это искажает результаты бенчмаркинга в пользу традиционных методов, которые усредняют эти колебания.
3. Почему важно разработать более совершенные методы бенчмаркинга для оценки климатических эмуляторов?
Более совершенные методы бенчмаркинга могут дать более полную картину того, какой метод климатического эмулирования лучше всего подходит для конкретной ситуации. Это поможет обеспечить принятие политиками решений на основе наилучшей доступной информации.
4. Какие ограничения есть у метода линейного масштабирования закономерностей (LPS)?
У метода LPS есть ограничения, например, он не прогнозирует изменчивость или экстремальные погодные явления. Это подчёркивает необходимость разработки более совершенных методов климатического эмулирования, которые могли бы учитывать эти факторы.
5. Какие перспективы открывает исследование для дальнейшего изучения проблем климатического эмулирования?
Исследование подчёркивает необходимость разработки более совершенных методов бенчмаркинга и климатического эмулирования. Такие исследования могли бы изучить ориентированные на воздействие показатели, такие как индикаторы засухи и риски лесных пожаров, или новые переменные, такие как региональные скорости ветра. Это может помочь в более точном прогнозировании климатических изменений и разработке соответствующих стратегий адаптации и смягчения последствий.