Модели генеративного искусственного интеллекта используются для создания обширных библиотек теоретических материалов, которые могут помочь решить самые разные задачи. Теперь учёным нужно только понять, как их использовать.
Синтез материалов: не всё так просто
Во многих случаях синтез материалов — это не просто следование рецепту на кухне. Такие факторы, как температура и продолжительность обработки, могут сильно влиять на свойства материала, что делает его более или менее эффективным. Это ограничивает возможности исследователей тестировать миллионы перспективных материалов, созданных с помощью моделей.
Исследователи из Массачусетского технологического института (MIT) создали модель искусственного интеллекта, которая помогает учёным в процессе создания материалов, предлагая перспективные пути синтеза. В новой статье они показали, что модель обеспечивает современную точность в прогнозировании эффективных путей синтеза для класса материалов, называемых цеолитами. Эти материалы могут быть использованы для улучшения процессов катализа, абсорбции и ионного обмена.
Следуя рекомендациям модели, команда синтезировала новый материал с цеолитной структурой, который показал улучшенную термическую стабильность.
Исследователи считают, что их новая модель может преодолеть самое серьёзное препятствие в процессе открытия материалов.
«Чтобы использовать аналогию, мы знаем, какой торт хотим приготовить, но сейчас мы не знаем, как его испечь», — говорит ведущий автор Элтон Пэн, кандидат наук в Департаменте материаловедения и инженерии (DMSE) MIT. «Синтез материалов в настоящее время осуществляется с помощью экспертных знаний и методом проб и ошибок».
Обучение «выпечке»
Массивные инвестиции в генеративный искусственный интеллект привели такие компании, как Google и Meta, к созданию огромных баз данных, заполненных рецептами материалов, которые теоретически обладают такими свойствами, как высокая термическая стабильность и селективное поглощение газов. Но создание этих материалов может потребовать недель или месяцев тщательных экспериментов, в ходе которых проверяются конкретные температуры реакций, время, соотношения исходных материалов и другие факторы.
«Люди полагаются на свою химическую интуицию, чтобы направлять процесс», — говорит Пэн. «Люди линейны. Если есть пять параметров, мы можем оставить четыре из них постоянными и линейно изменять один из них. Но машины гораздо лучше рассуждают в многомерном пространстве».
Процесс синтеза материалов часто занимает больше всего времени на пути от гипотезы к использованию.
Чтобы помочь учёным ориентироваться в этом процессе, исследователи из MIT обучили модель генеративного искусственного интеллекта более чем 23 000 рецептам синтеза материалов, описанным в научных статьях за 50 лет. Во время обучения исследователи итеративно добавляли случайный «шум» в рецепты, и модель научилась удалять шум и выбирать из него перспективные пути синтеза.
В результате появился DiffSyn, который использует подход в искусственном интеллекте, известный как диффузия.
«Диффузионные модели — это, по сути, модель генеративного искусственного интеллекта, подобная ChatGPT, но больше похожая на модель генерации изображений DALL-E», — говорит Пэн. «Во время логического вывода он преобразует шум в осмысленную структуру, вычитая немного шума на каждом шаге. В этом случае «структура» — это путь синтеза для желаемого материала».
Когда учёный, использующий DiffSyn, вводит желаемую структуру материала, модель предлагает несколько перспективных комбинаций температур реакций, времени реакций, соотношений исходных материалов и т. д.
«По сути, он говорит вам, как испечь торт», — говорит Пэн. «У вас в голове есть торт, вы вводите его в модель, модель выдаёт рецепты синтеза. Учёный может выбрать любой путь синтеза, который он хочет, и есть простые способы количественно оценить наиболее перспективный путь синтеза из того, что мы предоставляем, что мы показываем в нашей статье».
Для тестирования своей системы исследователи использовали DiffSyn для предложения новых путей синтеза цеолита — сложного материала, для формирования которого в тестируемый материал требуется много времени.
«Цеолиты имеют очень многомерное пространство синтеза», — говорит Пэн. «Цеолиты также имеют свойство кристаллизоваться в течение нескольких дней или недель, поэтому влияние [нахождения наилучшего пути синтеза быстрее] намного выше, чем у других материалов, которые кристаллизуются в течение нескольких часов».
Исследователи смогли создать новый материал с цеолитной структурой, используя пути синтеза, предложенные DiffSyn. Последующее тестирование показало, что материал имеет многообещающую морфологию для каталитических применений.
«Учёные пробуют разные рецепты синтеза один за другим», — говорит Пэн. «Это отнимает у них много времени. Эта модель может перебрать 1 000 из них менее чем за минуту. Она даёт вам очень хорошее первоначальное предположение о рецептах синтеза для совершенно новых материалов».
Учёт сложности
Ранее исследователи создавали модели машинного обучения, которые сопоставляли материал с одним рецептом. Эти подходы не учитывают, что существует несколько способов получения одного и того же материала.
DiffSyn обучен сопоставлять структуры материалов со множеством различных возможных путей синтеза. Пэн говорит, что это лучше соответствует экспериментальной реальности.
«Это сдвиг парадигмы от однозначного сопоставления между структурой и синтезом к однозначной связи со множеством», — говорит Пэн. «Это основная причина, по которой мы достигли значительных успехов в тестах».
В дальнейшем исследователи считают, что такой подход должен работать для обучения других моделей, которые направляют синтез материалов помимо цеолитов, включая металлоорганические каркасы, неорганические твёрдые вещества и другие материалы, имеющие более одного возможного пути синтеза.
«Этот подход может быть распространён на другие материалы», — говорит Пэн. «Сейчас узкое место — поиск высококачественных данных для разных классов материалов. Но цеолиты сложны, так что я могу представить, что они близки к верхней границе сложности. В конечном итоге цель будет заключаться в сопряжении этих интеллектуальных систем с автономными экспериментами в реальных условиях и агентским рассуждением на основе экспериментальных данных для существенного ускорения процесса проектирования материалов».
Работа была поддержана MIT International Science and Technology Initiatives (MISTI), Национальным научным фондом, Generalitat Vaslenciana, Управлением военно-морских исследований, ExxonMobil и Агентством по науке, технологиям и исследованиям в Сингапуре.
1. Как генеративный искусственный интеллект помогает учёным в синтезе материалов?
Ответ: генеративный искусственный интеллект помогает учёным в синтезе материалов путём создания обширных библиотек теоретических материалов и предложения перспективных путей синтеза. Это позволяет учёным сократить время и ресурсы, затрачиваемые на эксперименты, и сосредоточиться на наиболее перспективных направлениях.
2. Какие факторы влияют на свойства материалов при синтезе?
Ответ: на свойства материалов при синтезе влияют такие факторы, как температура и продолжительность обработки. Эти факторы могут сильно влиять на эффективность материала, что делает его более или менее эффективным.
3. Какие преимущества предлагает модель DiffSyn по сравнению с традиционными методами синтеза материалов?
Ответ: модель DiffSyn предлагает несколько преимуществ по сравнению с традиционными методами синтеза материалов. Она может перебирать тысячи рецептов синтеза менее чем за минуту, что значительно сокращает время, необходимое для поиска перспективных путей синтеза. Кроме того, модель учитывает многомерность пространства синтеза и предлагает несколько перспективных комбинаций параметров, что позволяет учёным выбрать наиболее подходящий путь синтеза.
4. Какие материалы были использованы для тестирования модели DiffSyn?
Ответ: для тестирования модели DiffSyn исследователи использовали цеолиты — сложные материалы, для формирования которых требуется много времени. Цеолиты имеют многомерное пространство синтеза, что делает их хорошим объектом для тестирования модели.
5. Какие перспективы развития генеративного искусственного интеллекта в области синтеза материалов видит автор статьи?
Ответ: автор статьи видит перспективы развития генеративного искусственного интеллекта в области синтеза материалов в создании моделей, которые будут направлять синтез не только цеолитов, но и других материалов, имеющих более одного возможного пути синтеза. Это может включать металлоорганические каркасы, неорганические твёрдые вещества и другие материалы. Кроме того, автор считает, что генеративный искусственный интеллект может быть сопряжён с автономными экспериментами в реальных условиях и агентским рассуждением на основе экспериментальных данных для существенного ускорения процесса проектирования материалов.