Исследование Вселенной: быстрее и с той же точностью

Если вы считаете, что галактика велика, сравните её с размером Вселенной: это всего лишь крошечная точка, которая вместе с огромным количеством других крошечных точек образует скопления, которые объединяются в сверхскопления, которые, в свою очередь, образуют нити с пустотами — огромный трёхмерный скелет нашей Вселенной.

Если это вызывает у вас головокружение и вы задаётесь вопросом, как можно понять или даже «увидеть» что-то настолько обширное, ответ таков: это непросто. Учёные объединяют физику Вселенной с данными астрономических инструментов и строят теоретические модели, такие как EFTofLSS (Effective Field Theory of Large-Scale Structure). Эти модели, основанные на наблюдениях, статистически описывают «космическую паутину» и позволяют оценить её ключевые параметры.

Однако такие модели, как EFTofLSS, требуют много времени и вычислительных ресурсов. Поскольку астрономические наборы данных, которыми мы располагаем, растут в геометрической прогрессии, нам нужны способы упростить анализ без потери точности. Именно для этого и существуют эмуляторы: они «имитируют» реакцию моделей, но работают гораздо быстрее.

Поскольку это своего рода «сокращение пути», каков риск потери точности? Международная группа, в которую входят, среди прочих, INAF (Италия), Университет Пармы (Италия) и Университет Ватерлоо (Канада), опубликовала в журнале Journal of Cosmology and Astroparticle Physics исследование, посвящённое проверке эмулятора Effort.jl, который они разработали. Исследование называется «Effort.jl: a fast and differentiable emulator for the Effective Field Theory of the Large Scale Structure of the Universe».

Исследование показывает, что Effort.jl обеспечивает практически такую же точность, как и модель, которую он имитирует, — иногда даже более тонкие детали, — при этом работая за минуты на стандартном ноутбуке вместо суперкомпьютера.

«Представьте, что вы хотите изучить содержимое стакана воды на уровне его микроскопических компонентов, отдельных атомов или даже мельче: теоретически вы можете. Но если мы хотим подробно описать, что происходит, когда вода движется, взрывной рост требуемых вычислений делает это практически невозможным», — объясняет Марко Боничи, исследователь из Университета Ватерлоо и первый автор исследования.

«Однако вы можете закодировать определённые свойства на микроскопическом уровне и увидеть их эффект на макроскопическом уровне, а именно движение жидкости в стакане. Это то, что делает эффективная теория поля, то есть модель, подобная EFTofLSS, где вода в моём примере — это Вселенная в очень больших масштабах, а микроскопические компоненты — это физические процессы в малых масштабах», — продолжает Боничи.

Теоретическая модель статистически объясняет структуру, которая порождает собранные данные: астрономические наблюдения подаются в код, который вычисляет «предсказание». Но это требует времени и значительных вычислительных ресурсов. Учитывая сегодняшний объём данных и то, что ожидается от опросов, которые только начались или скоро начнутся (таких как DESI, который уже выпустил свою первую порцию данных, и Euclid), исчерпывающий анализ каждый раз проводить нецелесообразно.

«Поэтому мы теперь обращаемся к эмуляторам, подобным нашему, которые могут значительно сократить время и ресурсы», — продолжает Боничи.

Эмулятор по сути имитирует то, что делает модель: его ядро — это нейронная сеть, которая учится связывать входные параметры с уже вычисленными моделью предсказаниями. Сеть обучается на выходных данных модели и после обучения может обобщать на комбинации параметров, которые она не видела. Эмулятор не «понимает» физику сама по себе: она хорошо знает ответы теоретической модели и может предвидеть, что она выдаст для нового ввода.

Оригинальность Effort.jl заключается в том, что он дополнительно сокращает фазу обучения, встраивая в алгоритм знания, которые у нас уже есть о том, как меняются прогнозы при изменении параметров: вместо того чтобы заставлять сеть «переучивать» их, он использует их с самого начала.

Effort.jl также использует градиенты — то есть «насколько и в каком направлении» меняются прогнозы, если вы немного измените параметр, — ещё один элемент, который помогает эмулятору учиться на гораздо меньшем количестве примеров, сокращая потребности в вычислениях и позволяя ему работать на небольших машинах.

Подобный инструмент требует тщательной проверки: если эмулятор не знает физики, насколько мы уверены, что его «сокращённый путь» даёт правильные ответы (то есть такие же, какие дала бы модель)? Недавно опубликованное исследование отвечает именно на этот вопрос, показывая, что точность Effort.jl — как на смоделированных, так и на реальных данных — находится в близком соответствии с моделью.

«И в некоторых случаях, когда с моделью вам приходится обрезать часть анализа, чтобы ускорить процесс, с Effort.jl мы смогли включить и эти недостающие части», — заключает Боничи.

Таким образом, Effort.jl становится ценным союзником для анализа предстоящих выпусков данных из таких экспериментов, как DESI и Euclid, которые обещают значительно углубить наши знания о Вселенной в больших масштабах.

Предоставлено SISSA Medialab.

Источник