Детективная работа в науке: как искусственный интеллект помогает решать обратные задачи
Решение великих загадок природы часто требует детективной работы, когда по наблюдаемым результатам нужно определить их причину. Например, физики-ядерщики в Национальном ускорительном центре Томаса Джефферсона (Thomas Jefferson National Accelerator Facility) при Министерстве энергетики США анализируют последствия взаимодействий частиц, чтобы понять структуру атомного ядра.
Что такое обратная задача?
Этот тип субатомного расследования известен как обратная задача. Она противоположна прямой задаче, где по причинам вычисляются следствия. Обратные задачи возникают во многих описаниях физических явлений, и часто их решение ограничено доступными экспериментальными данными.
Новый подход с использованием искусственного интеллекта
Учёные из Лаборатории Джефферсона и Аргоннской национальной лаборатории Министерства энергетики США в рамках сотрудничества QuantOm разработали технику искусственного интеллекта (ИИ), которая может надёжно решать такие задачи на суперкомпьютерах в больших масштабах.
«Мы поставили цель доказать, что можем использовать генеративный ИИ для лучшего понимания структуры протона», — сказал учёный по данным из Лаборатории Джефферсона Дэниел Лерш, ведущий исследователь проекта. «Но эта система не ограничивается ядерной физикой. Обратные задачи могут быть чем угодно».
Система называется SAGIPS (Scalable Asynchronous Generative Inverse-Problem Solver). Она основана на высокопроизводительных вычислениях и генеративных моделях ИИ, которые могут создавать новый текст, изображения или видео на основе данных, на которых обучены алгоритмы.
Применение в ядерной физике
В исследовании SAGIPS электрон — это «мяч», который является частью «игрушечной» задачи ядерной физики, основанной на инклюзивном глубоком неупругом рассеянии, при котором электрон измеряется после взаимодействия с другой частицей.
Но математика, стоящая за обратными задачами, может быть немного расплывчатой. Решения представлены в виде вероятностей, а не конкретных ответов. Использование решателя задач, такого как SAGIPS, может добавить ясности и определённости этим вероятностям, уменьшая неопределённости и приближая учёных к ответу.
Оптимизация вычислений
SAGIPS использует генеративно-состязательные сети (GANs), которые представляют собой дуэльные нейронные сети, взаимодействующие для получения значимых данных. Одна постоянно пытается обмануть другую, а другая пытается обнаружить подделки.
«Допустим, вы хотите получить изображение кошки», — сказал Лерш. «Генератор не знает, как выглядит кошка, поэтому делает предположение. Дискриминатор имеет доступ к реальным фотографиям кошек и может сообщить генератору, что он создал подделку. Генератор затем попытается нарисовать более реалистичное изображение кошки».
Этот процесс продолжается до тех пор, пока не будет получено реалистичное изображение.
Создание крошечных оптических устройств: прорыв в фотонике
Инженеры из Калифорнийского университета в Сан-Диего достигли долгожданной цели в области фотоники: создали крошечные оптические устройства, которые одновременно высокочувствительны и долговечны — два качества, которые долгое время считались фундаментально несовместимыми.
Это редкое сосуществование чувствительности и долговечности может привести к созданию нового поколения фотонных устройств, которые будут не только точными и мощными, но и более простыми и дешёвыми в производстве в больших масштабах. Это может открыть двери для передовых датчиков и технологий, начиная от высокочувствительной медицинской диагностики и экологических датчиков и заканчивая более безопасными системами связи, все они будут встроены в крошечные устройства размером с чип.
Преодоление противоречия
Команда под руководством Абдулая Ндао, профессора кафедры электротехники и вычислительной техники в Школе инженерии Джейкобса Калифорнийского университета в Сан-Диего, нашла способ преодолеть это противоречие.
«Наше исследование решает эту критическую задачу», — сказал Ндао. «Мы разработали новые фотонные устройства, которые одновременно высокочувствительны к окружающей среде и устойчивы к ошибкам изготовления и несовершенствам материалов».
Исследование было опубликовано в журнале Advanced Photonics.
Устройства основаны на физическом явлении, известном как субволновая фазовая сингулярность. Это происходит, когда свет ограничен пространством, меньшим, чем его собственная длина волны, так что он создаёт точку полной темноты — там, где интенсивность света падает до нуля, — в то время как его фаза продолжает плавно проходить через полный цикл. Эта сингулярность одновременно высокочувствительна к изменениям в окружающей среде, что делает её идеальной для сенсорных приложений, и достаточно прочна, чтобы справляться с несовершенствами производственных процессов.
Устройство на основе наноструктур
Субволновая фазовая сингулярность стала возможной благодаря специально разработанной наноструктуре. Исследователи создали устройство размером с чип, состоящее из двух слоёв золотых наностержней, между которыми находится чрезвычайно тонкий слой полимера. Нижний слой встроен в полимер, а верхний слой контактирует с воздухом, где он может взаимодействовать непосредственно с целевыми молекулами для обнаружения.
Наностержни в каждом слое расположены рядами, слегка скрученными под определённым углом относительно друг друга. Регулируя горизонтальное расстояние между двумя слоями, исследователи могут точно контролировать взаимодействие слоёв со светом.
В тестах исследователи продемонстрировали чувствительность и долговечность устройства, измерив фазовые сингулярности. Теоретические исследования и моделирование проводились соавторами-первыми авторами исследования Джун-Хи Парк, аспиранткой кафедры электротехники и вычислительной техники Калифорнийского университета в Сан-Диего, и Лии Ху, бывшим постдокторантом, оба из лаборатории Ндао. Изготовление устройства было выполнено соавтором-первым автором исследования Чонгхо Ха, а измерения проводил Гуан Ян, соавтор исследования — и Ха, и Ян являются выпускниками Калифорнийского университета в Сан-Диего по специальности «Электротехника и вычислительная техника» из лаборатории Ндао.
nuclear physics. Inverse problems can be anything.\””,”The system is called SAGIPS (Scalable Asynchronous Generative Inverse-Problem Solver). It relies on high-performance computing and generative AI models, which can produce new text, images or videos based on data the algorithms are trained on.”,”SAGIPS was built for QuantOm. Its goal is to better understand fundamental nuclear physics by using advanced computational methods, and the SAGIPS system was recently featured in the journal Machine Learning: Science and Technology.”,”Inverse problems can be found in most areas of science, from astrophysics to chemistry to medical imaging. The process can be likened to reverse engineering, said Nobuo Sato, a Jefferson Lab theoretical physicist and author on the paper.”,”\”Imagine throwing a ball into a dark hole,\” Sato said. \”If the ball bounces back in a particular pattern, you can play around with different directions and in principle infer what kind of surface is inside.\””,”In the SAGIPS study, the ball is an electron. It’s part of a \”toy\” nuclear physics problem based on inclusive deep inelastic scattering, in which an electron is measured after interacting with another particle.”,”But the math behind inverse problems can be a little fuzzy. Solutions are represented as probabilities instead of concrete answers. Using a problem-solver like SAGIPS can add clarity and definition to those probabilities, reducing uncertainties and bringing scientists closer to an answer.”,”SAGIPS ran a machine learning (ML) algorithm on the Polaris supercomputer cluster at the Argonne Leadership Computing Facility, a DOE Office of Science user facility in the Advanced Scientific Computing Research (ASCR) portfolio. Using 400 processing cores, SAGIPS solved the toy problem and showed promise for solving larger problems on an even more powerful supercomputer.”,”\”This technique scales linearly with the available computing resources, which means we could process much bigger problems on a much bigger cluster,\” said Malachi Schram, Jefferson Lab’s head of data science and a co-author on the paper. \”That’s the heart of it.\””,”SAGIPS uses generative adversarial networks (GANs), which are dueling neural networks that interact to produce meaningful data. One is constantly trying to trick the other, and the other is trying to spot fakes.”,”\”Let’s say you want an image of a cat,\” Lersch said. \”The generator doesn’t know what a cat looks like, so it takes a guess. The discriminator has access to real cat pictures and can communicate to the generator that it produced a fake. The generator will then attempt to draw a more realistic picture of a cat.\””,”This back and forth continues until a realistic image is produced.”,”The GANs are hosted on graphics processing units (GPUs). SAGIPS groups GPUs in a ring-like fashion with remote memory access, allowing the GPUs to directly access each other’s data and share their own. This reduces communication bottlenecks and speeds up processing. SAGIPS exploits Gustafson’s law, running faster as more computer resources are available.”,”\”Imagine that the processing of data on one machine is slower because of the statistical variations in the workflow,\” Schram said. \”They show up maybe seconds behind. If this happens at scale, these delays become horrendous. With an asynchronous ring-all-reduce approach, the GPUs don’t have to wait.\””,”SAGIPS was supported by SciDAC through the QuantOm project (Quantum Chromodynamics Nuclear Tomography). QuantOm is a DOE Office of Science partnership between ASCR and the Office of Nuclear Physics, and it is interested in the 3D imaging of protons, neutrons and nuclei by running particle accelerator data on supercomputers. The goal is to support current and future DOE Office Science user facilities, such as the Continuous Electron Beam Accelerator Facility (CEBAF) at Jefferson Lab and the future Electron-Ion Collider at Brookhaven National Laboratory.”,”\”It’s very easy to use some of these algorithms for different projects, and this minimizes the overhead costs of redesigning and rebuilding software stacks,\” Schram said. \”Jefferson Lab’s Data Science Department is focused on building capabilities, not one-off solutions.\””,”Now that the concept is proven on Argonne’s Polaris cluster, the SAGIPS team wants to leverage it on the exascale (1 quintillion flops, or 1 exaflop). Another computer at Argonne, named Aurora, is the first in the world to reach that speed.”,”\”It’s fascinating that bridging the gap between experimentalists and theorists includes another experiment in and of itself,\” Sato said. \”And that experiment is called high-performance computing.\””,”\n\t\t\t\t\t\t\t\t\t\t\t\t\tProvided by\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\tThomas Jefferson National Accelerator Facility\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t”,”\n\t\t\t\t\t\t\tMore from Other Physics Topics\n\t\t\t\t\t\t “]’>Источник