Предсказание того, когда сложная система — такая как климатическая сеть, экономика или даже человеческое сердце — находится на грани резкого коллапса, долгое время было одной из самых сложных задач науки. Эти так называемые критические переходы — внезапные сдвиги между стабильными состояниями системы, например, от здоровой экосистемы к разрушенной — могут вызвать быстрые и необратимые изменения, от экологических коллапсов до эпилептических припадков, без явных предупреждений.
Новое исследование под руководством доктора Чжициня Ма и профессора Чуньхуа Цзэна из Куньминского технологического университета науки в сотрудничестве с профессором И-Ченгом Чжаном из Северного университета Китая и доктором Томасом Бери из Университета Макгилла представляет прорывной подход с использованием машинного обучения для обнаружения ранних признаков таких переходов. Их работа, опубликованная в Communications Physics, описывает метод, специфичный для системы, который учится на исторических данных, чтобы предсказывать переломные моменты более точно, чем предыдущие универсальные модели.
Преодоление ограничений
Предыдущие методы прогнозирования основывались на общих сигналах, таких как увеличение дисперсии (мера того, насколько данные колеблются с течением времени) или автокорреляция с задержкой в один шаг (измеряет, насколько система похожа на своё недавнее прошлое). Однако эти индикаторы часто не срабатывали при применении к реальным зашумлённым наборам данных.
Доктор Ма объяснил: «Общие сигналы раннего предупреждения могут не сигнализировать о переходе, если временной ряд слишком короткий, слишком шумный или слишком нестационарный, или если переход соответствует не локальной бифуркации, а глобальной бифуркации или вообще не бифуркации».
Чтобы преодолеть эти ограничения, команда обучила модели машинного обучения на суррогатных данных — искусственно сгенерированных наборах данных, которые статистически напоминают реальные, — позволяя моделям изучать уникальные, специфичные для системы особенности, не полагаясь на ограничительные теоретические предположения.
Новый подход
Доктор Ма и её коллеги разработали новую систему под названием Surrogate Data-based Machine Learning (машинное обучение на основе суррогатных данных), которая генерирует огромные объёмы обучающих данных, воспроизводя статистические закономерности, обнаруженные в исторических событиях. Их подход был протестирован на различных примерах из реального мира, включая обеднённые кислородом океанские отложения, древние человеческие общества и биологические сердечные ритмы.
Когда по сравнению с традиционными индикаторами, такими как дисперсия и автокорреляция, машинное обучение на основе суррогатных данных последовательно демонстрировало более высокую чувствительность, что означает, что оно может точно обнаруживать истинные предупреждения, и большую специфичность, позволяя избегать ложных тревог.
Модели были протестированы с использованием различных типов систем машинного обучения, включая свёрточные нейронные сети, которые выявляют пространственные и временные закономерности; сети с долгой краткосрочной памятью, которые распознают долгосрочные связи в данных; и машины опорных векторов, которые разделяют информацию на отдельные категории, находя наилучшие границы разделения.
Эти алгоритмы достигли замечательных показателей производительности — комбинированная статистическая мера точности и аккуратности — которые в нескольких случаях были близки к совершенству.
Реальные примеры
Команда проанализировала реальные примеры быстрых переходов. В кернах отложений из Средиземного моря они обнаружили повторяющиеся эпизоды, когда уровень кислорода резко падал — события, исторически связанные с морской аноксией, полной потерей кислорода в океанской воде, которая может привести к массовым вымираниям. Модель машинного обучения на основе суррогатных данных, обученная на более ранних переходах, успешно предсказала более поздние.
Аналогично, при применении к ледяным кернам из Антарктиды подход предсказал резкие сдвиги температуры, которые положили конец ледниковым периодам. Он также обнаружил культурные переломные моменты в доиспанских обществах пуэбло, где данные о строительной активности показали, что коллапсу обществ предшествовало критическое замедление, то есть постепенная потеря устойчивости и увеличение времени восстановления после небольших возмущений перед полным коллапсом.
Оценка производительности
Оценка производительности показала, что машинное обучение на основе суррогатных данных превосходило стандартные методы в большинстве случаев, особенно в сценариях, где переходы не следовали классическим моделям бифуркации.
Доктор Ма отметил: «Наш метод не ограничен ограничивающим предположением о локальной бифуркации, как предыдущие методы. Обучаясь непосредственно на данных о прошлых переходах, он адаптируется к реальной системе, которую прогнозирует».
Исследование также продемонстрировало, что классификаторы машинного обучения на основе суррогатных данных сохраняли устойчивость при использовании различных методов генерации суррогатов, включая преобразования Фурье с регулировкой амплитуды, которые являются математическими методами, создающими новые данные, сохраняя при этом общую изменчивость и структуру исходного временного ряда.
Команда также использовала итеративные алгоритмы, которые сохраняют сложные свойства в данных, основанных на времени, для повышения точности.
Применение в различных областях
Помимо экологических и биологических систем, этот метод может преобразовать прогнозирование рисков в экономике, энергетических сетях и общественном здравоохранении. Многие катастрофические события, такие как финансовые кризисы или отключения электроэнергии, возникают из-за переплетения динамики, которая не поддаётся простым математическим моделям.
Обучаясь на данных о прошлых переходах, машинное обучение на основе суррогатных данных может предоставить решающее время для смягчения или предотвращения коллапса. «Классификаторы машинного обучения, обученные на богатых суррогатных данных о прошлых переходах, могут иметь решающее значение для расширения наших возможностей по подготовке к критическим переходам или их предотвращению», — сказал доктор Ма, подчеркнув, что этот подход дополняет, а не заменяет существующие инструменты раннего предупреждения.
Доктор Ма и её команда подчеркнули, что будущие разработки будут сосредоточены на совершенствовании того, как модели интерпретируют различные расстояния до перехода, превращая классификацию в более непрерывную и динамическую меру риска.
Они считают, что по мере того, как будет становиться доступно всё больше высококачественных временных рядов данных — долгосрочных измерений, собранных через равные промежутки времени, — система машинного обучения на основе суррогатных данных будет продолжать развиваться, предоставляя мощный и единый способ понимания стабильности и устойчивости в системах, начиная от природных экосистем и заканчивая глобальными экономиками.
О авторах
Доктор Чжицинь Ма имеет степень бакалавра по физике и докторскую степень по системной науке в Куньминском технологическом университете науки и технологий, Куньмин, Китай. Его исследования сосредоточены на статистической физике и сложных системах, обнаружении и анализе сигналов раннего предупреждения и применении машинного обучения в сложных системах.
Профессор Чуньхуа Цзэн занимается исследованиями в области статистической физики и сложных систем. Он опубликовал более 120 научных работ в журналах, таких как Natil. Sci. Rev., Comm. Phys., Phys. Rev. B, Phys. Rev. Research и Phys. Rev. E.
Доктор И-Ченг Чжан — старший профессор физики в Университете Фрибурга, Швейцария, и член Academia Europaea. Он получил докторскую степень в Sissa Trieste и Университете Ла Сапиенца. Его исследования охватывают большие данные, искусственный интеллект, сложные сети, экономику информации, киберфизические системы, статистическую физику, науку о сложности и финансы.
Доктор Томас Бери занимается исследованиями на стыке машинного обучения и нелинейной динамики. Он заинтересован в разработке сигналов раннего предупреждения для переломных моментов в широком спектре сложных систем. Он имеет докторскую степень в области прикладной математики в Университете Ватерлоо и опубликовал свои работы в таких журналах, как PNAS и Nature Communications.