ИИ учится на ошибках прошлого, чтобы предсказать следующую глобальную катастрофу

Предсказание того, когда сложная система — такая как климатическая сеть, экономика или даже человеческое сердце — окажется на грани резкого коллапса, долгое время было одной из самых сложных задач науки. Эти так называемые критические переходы — внезапные сдвиги между стабильными состояниями системы, например, от здоровой экосистемы к разрушенной — могут вызвать быстрые и необратимые изменения, от экологических коллапсов до эпилептических припадков, без явных предупреждений.

Новое исследование под руководством доктора Чжициня Ма и профессора Чуньхуа Цзэна из Куньминского технологического университета науки в сотрудничестве с профессором И-Ченгом Чжаном из Северного университета Китая и доктором Томасом Бери из Университета Макгилла предлагает новаторский подход с использованием машинного обучения для выявления ранних признаков таких переходов. Их работа, опубликованная в журнале Communications Physics, описывает метод, специфичный для системы, который учится на исторических данных, чтобы предсказывать точки перехода более точно, чем предыдущие универсальные модели.

Преодоление ограничений традиционных методов

Предыдущие методы прогнозирования опирались на общие сигналы, такие как увеличение дисперсии (мера того, насколько данные колеблются во времени) или автокорреляция с задержкой в один шаг (измеряет, насколько система похожа на своё недавнее прошлое). Однако эти индикаторы часто терпели неудачу при применении к реальным зашумлённым наборам данных.

Доктор Ма объяснил: «Общие сигналы раннего предупреждения могут не сигнализировать о переходе, если временной ряд слишком короткий, слишком шумный или слишком нестационарный, или если переход соответствует не локальной бифуркации, а глобальной бифуркации или вообще не бифуркации».

Чтобы преодолеть эти ограничения, команда обучила модели машинного обучения на суррогатных данных — искусственно сгенерированных наборах данных, которые статистически напоминают реальные. Это позволило моделям изучить уникальные особенности поведения системы, не полагаясь на ограничительные теоретические предположения.

Новый подход: машинное обучение на основе суррогатных данных

Доктор Ма и её коллеги разработали новую систему под названием «Машинное обучение на основе суррогатных данных» (Surrogate Data-based Machine Learning), которая генерирует огромные объёмы обучающих данных, воспроизводя статистические закономерности, обнаруженные в исторических событиях. Их подход был протестирован на различных реальных примерах, включая обеднённые кислородом донные отложения океана, древние человеческие общества и биологические сердечные ритмы.

По сравнению с традиционными индикаторами, такими как дисперсия и автокорреляция, машинное обучение на основе суррогатных данных последовательно демонстрировало более высокую чувствительность и специфичность. Это означает, что он мог точно обнаруживать истинные предупреждения и избегать ложных тревог.

Модели были протестированы с использованием различных типов систем машинного обучения, включая свёрточные нейронные сети, которые выявляют пространственные и временные закономерности; сети с длинной краткосрочной памятью, которые распознают долгосрочные связи в данных; и машины опорных векторов, которые разделяют информацию на отдельные категории, находя наилучшие границы разделения.

Эти алгоритмы достигли замечательных показателей производительности — комбинированная статистическая мера точности и точности — которые в некоторых случаях были близки к совершенству.

Применение в реальных условиях

Команда проанализировала реальные примеры быстрых переходов. В кернах отложений из Средиземного моря они обнаружили повторяющиеся эпизоды, когда уровень кислорода резко падал — события, исторически связанные с морской аноксией, полной потерей кислорода в океанской воде, которая может привести к массовым вымираниям. Модель машинного обучения на основе суррогатных данных, обученная на более ранних переходах, успешно предсказала более поздние.

Аналогично, при применении к данным ледяных кернов из Антарктиды подход предсказал резкие температурные сдвиги, которые положили конец ледниковым периодам. Он также обнаружил культурные переломные моменты в доиспанских обществах пуэбло, где данные о строительной активности показали, что коллапсу обществ предшествовало критическое замедление, то есть постепенная потеря устойчивости и увеличение времени восстановления после небольших возмущений перед полным коллапсом.

Оценка производительности

Оценка производительности показала, что машинное обучение на основе суррогатных данных превосходило стандартные методы в большинстве случаев, особенно в сценариях, где переходы не следовали классическим моделям бифуркации.

Доктор Ма отметил: «Наш метод не связан с ограничивающим предположением о локальной бифуркации, как предыдущие методы. Обучаясь непосредственно на данных о прошлых переходах, он адаптируется к реальной системе, которую прогнозирует».

Исследование также продемонстрировало, что классификаторы машинного обучения на основе суррогатных данных сохраняли устойчивость при использовании различных методов генерации суррогатов, включая амплитудно-регулируемые преобразования Фурье, которые являются математическими методами, создающими новые данные при сохранении как общей изменчивости, так и структуры исходного временного ряда.

Команда также использовала итеративные алгоритмы, которые сохраняют сложные свойства в данных, основанных на времени, для повышения точности.

Перспективы

Помимо экологических и биологических систем, этот метод может изменить прогнозирование рисков в экономике, энергетических сетях и общественном здравоохранении. Многие катастрофические события, такие как финансовые кризисы или отключения электросети, возникают из-за переплетения динамики, которая не поддаётся простым математическим моделям.

Доктор Ма и её команда подчеркнули, что будущие разработки будут сосредоточены на совершенствовании того, как модели интерпретируют различные расстояния до перехода, превращая классификацию в более непрерывную и динамическую меру риска. Они считают, что по мере появления всё большего количества высококачественных временных рядов данных — долгосрочных измерений, собранных через равные промежутки времени — система машинного обучения на основе суррогатных данных будет продолжать развиваться, предоставляя мощный и единый способ понимания стабильности и устойчивости в системах, начиная от природных экосистем и заканчивая глобальными экономиками.

Это инновационное сочетание моделирования исторических данных и искусственного интеллекта знаменует собой важный шаг к предвидению непредсказуемого. Обучаясь на отголосках прошлых кризисов, машинное обучение на основе суррогатных данных открывает путь к предвидению — и, возможно, предотвращению — следующего крупного переломного момента в природе или обществе.

Ссылка на журнал

Ma Zhiqin, Zeng Chunhua, Zhang Yi-Cheng, and Bury Thomas M. “Predicting critical transitions with machine learning trained on surrogates of historical data.” Communications Physics (2025). DOI: https://doi.org/10.1038/s42005-025-02172-4

Об авторах

Доктор Чжицинь Ма имеет степень бакалавра по физике и докторскую степень по системной науке в Куньминском технологическом университете науки и технологий, Куньмин, Китай. Его исследования сосредоточены на статистической физике и сложных системах, обнаружении и анализе сигналов раннего предупреждения, а также на применении машинного обучения в сложных системах.

Профессор Чуньхуа Цзэн в основном занимается исследованиями в области статистической физики и сложных систем. Он опубликовал более 120 научных статей в журналах, таких как Natil. Sci. Rev., Comm. Phys., Phys. Rev. B, Phys. Rev. Research и Phys. Rev. E.

Доктор И-Ченг Чжан — старший профессор физики в Университете Фрибурга, Швейцария, и член Academia Europaea. Он получил докторскую степень в Sissa Trieste и Университете Ла Сапиенца. Его исследования охватывают большие данные, искусственный интеллект, сложные сети, экономику информации, киберфизические системы, статистическую физику, науку о сложности и финансы.

Доктор Томас Бери занимается исследованиями на стыке машинного обучения и нелинейной динамики. Он заинтересован в разработке сигналов раннего предупреждения для точек перехода в широком спектре сложных систем. Он имеет докторскую степень в области прикладной математики в Университете Ватерлоо и опубликовал свои работы в таких журналах, как PNAS и Nature Communications.

Источник