Модели машинного обучения могут ускорить открытие новых материалов, делая прогнозы и предлагая эксперименты. Однако большинство моделей сегодня учитывают лишь несколько конкретных типов данных или переменных. Сравните это с учёными, которые работают в условиях сотрудничества и учитывают результаты экспериментов, обширную научную литературу, изображения и структурный анализ, личный опыт или интуицию, а также отзывы коллег и рецензентов.
Новая платформа для оптимизации экспериментов
Исследователи из Массачусетского технологического института (MIT) разработали метод оптимизации рецептов материалов и планирования экспериментов, который включает информацию из различных источников, таких как научные публикации, химический состав, микроструктурные изображения и многое другое. Этот подход является частью новой платформы под названием Copilot for Real-world Experimental Scientists (CRESt), которая также использует роботизированное оборудование для высокопроизводительных испытаний материалов. Результаты этих испытаний передаются в большие мультимодальные модели для дальнейшей оптимизации рецептов материалов.
Исследователи могут общаться с системой на естественном языке без необходимости кодирования. Система делает собственные наблюдения и выдвигает гипотезы. Камеры и модели визуального языка также позволяют системе отслеживать эксперименты, обнаруживать проблемы и предлагать исправления.
«В области искусственного интеллекта для науки ключевым моментом является разработка новых экспериментов», — говорит Джу Ли, профессор инженерной школы MIT. «Мы используем мультимодальную обратную связь — например, информацию из предыдущей литературы о том, как палладий вёл себя в топливных элементах при такой температуре, и обратную связь от человека — чтобы дополнить экспериментальные данные и разработать новые эксперименты. Мы также используем роботов для синтеза и характеристики структуры материала и для проверки производительности».
Система описана в статье, опубликованной в журнале Nature. Исследователи использовали CRESt для изучения более чем 900 химических составов и проведения 3500 электрохимических тестов, что привело к открытию материала-катализатора, который обеспечил рекордную плотность мощности в топливном элементе, работающем на соли формиата для производства электроэнергии.
Умная система
Эксперименты в области материаловедения могут быть трудоёмкими и дорогостоящими. Они требуют от исследователей тщательного планирования рабочих процессов, создания новых материалов и проведения серии тестов и анализов, чтобы понять, что произошло. Полученные результаты затем используются для решения вопроса о том, как улучшить материал.
Чтобы усовершенствовать процесс, некоторые исследователи обратились к стратегии машинного обучения, известной как активное обучение, чтобы эффективно использовать предыдущие экспериментальные данные и исследовать или использовать эти данные. В сочетании со статистической методикой, известной как байесовская оптимизация (BO), активное обучение помогло исследователям выявить новые материалы для таких вещей, как батареи и передовые полупроводники.
«Байесовская оптимизация похожа на то, как Netflix рекомендует следующий фильм для просмотра на основе вашей истории просмотров, только вместо этого она рекомендует следующий эксперимент», — объясняет Ли. «Но базовая байесовская оптимизация слишком упрощена. Она использует ограниченное пространство проектирования, поэтому, если я скажу, что буду использовать платину, палладий и железо, она будет менять только соотношение этих элементов в этом небольшом пространстве. Но у реальных материалов гораздо больше зависимостей, и BO часто теряется».
Большинство подходов к активному обучению также полагаются на отдельные потоки данных, которые не отражают всего, что происходит в эксперименте. Чтобы оснастить вычислительные системы более человекоподобными знаниями, сохраняя при этом скорость и контроль автоматизированных систем, Ли и его коллеги создали CRESt.
CRESt: помощник в научных исследованиях
Роботизированное оборудование CRESt включает в себя робота для работы с жидкостями, систему карботермического шока для быстрого синтеза материалов, автоматизированное электрохимическое рабочее место для тестирования, оборудование для характеризации, включая автоматизированную электронную микроскопию и оптическую микроскопию, а также вспомогательные устройства, такие как насосы и газовые клапаны, которые также можно дистанционно контролировать.
С помощью пользовательского интерфейса исследователи могут общаться с CRESt и поручить ему использовать активное обучение для поиска перспективных рецептов материалов для различных проектов. CRESt может включать в свой рецепт до 20 исходных молекул и субстратов. Чтобы направлять разработку материалов, модели CRESt ищут в научных статьях описания элементов или исходных молекул, которые могут быть полезны. Когда исследователи-люди поручают CRESt разработать новые рецепты, система запускает роботизированную симфонию подготовки образцов, характеризации и тестирования.
Информация, полученная в результате этих процессов, используется для обучения моделей активного обучения, которые используют как литературные знания, так и текущие экспериментальные результаты, чтобы предложить дальнейшие эксперименты и ускорить открытие материалов.
«Для каждого рецепта мы используем предыдущий текст из литературы или базы данных, и он создаёт эти огромные представления каждого рецепта, основанные на предыдущей базе знаний, прежде чем даже провести эксперимент», — говорит Ли. «Мы выполняем анализ главных компонентов в этом пространстве встраивания знаний, чтобы получить уменьшенное пространство поиска, которое отражает большую часть изменчивости производительности. Затем мы используем байесовскую оптимизацию в этом уменьшенном пространстве для разработки нового эксперимента. После нового эксперимента мы передаём недавно полученные мультимодальные экспериментальные данные и отзывы человека в большую языковую модель для расширения базы знаний и перераспределения уменьшенного пространства поиска, что значительно повышает эффективность активного обучения».
Эксперименты в области материаловедения также могут столкнуться с проблемами воспроизводимости. Чтобы решить эту проблему, CRESt отслеживает свои эксперименты с помощью камер, выявляя потенциальные проблемы и предлагая решения через текст и голос исследователям-людям.
Результаты показывают потенциал CRESt для поиска решений реальных энергетических проблем, которые десятилетиями преследовали сообщество материаловедов и инженеров.
«Значительной проблемой для катализаторов топливных элементов является использование драгоценных металлов», — говорит Чжэн. «Для топливных элементов исследователи использовали различные драгоценные металлы, такие как палладий и платина. Мы использовали многоэлементный катализатор, который также включает в себя множество других дешёвых элементов для создания оптимальной координационной среды для каталитической активности и устойчивости к отравляющим веществам, таким как окись углерода и адсорбированный атом водорода. Люди искали недорогие варианты в течение многих лет. Эта система значительно ускорила наш поиск этих катализаторов».
Полезный помощник
На ранних этапах плохая воспроизводимость стала серьёзной проблемой, ограничивающей способность исследователей применять свою новую технику активного обучения к экспериментальным наборам данных. На свойства материала может влиять способ смешивания и обработки прекурсоров, и любое количество проблем может незаметно изменить условия эксперимента, требуя тщательного осмотра для исправления.
Чтобы частично автоматизировать процесс, исследователи объединили компьютерное зрение и модели визуального языка со знаниями из научной литературы, что позволило системе выдвигать гипотезы об источниках неповторяемости и предлагать решения. Например, модели могут заметить, когда есть отклонение в форме образца на миллиметр или когда пипетка перемещает что-то не на своё место. Исследователи учли некоторые предложения модели, что привело к улучшению согласованности, предполагая, что модели уже являются хорошими экспериментальными помощниками.
Исследователи отметили, что люди всё ещё выполняли большую часть отладки в своих экспериментах.
«CRESt — это помощник, а не замена для исследователей-людей», — говорит Ли. «Исследователи-люди по-прежнему незаменимы. На самом деле мы используем естественный язык, чтобы система могла объяснить, что она делает, и представить наблюдения и гипотезы. Но это шаг к более гибким, самоуправляемым лабораториям».
Вопросы по тексту:
1. Какие проблемы в научных исследованиях решает платформа CRESt?
Ответ:
Платформа CRESt решает проблему трудоёмкости и высокой стоимости экспериментов в области материаловедения, а также проблему воспроизводимости результатов. Она позволяет эффективно использовать предыдущие экспериментальные данные и исследовать их с помощью активного обучения и байесовской оптимизации.
2. Какие типы данных и переменных учитывает платформа CRESt при оптимизации рецептов материалов?
Ответ:
CRESt учитывает информацию из различных источников, таких как научные публикации, химический состав, микроструктурные изображения и многое другое. Система также использует роботизированное оборудование для высокопроизводительных испытаний материалов и получает результаты этих испытаний для дальнейшей оптимизации рецептов материалов.
3. Какие преимущества даёт использование платформы CRESt в научных исследованиях?
Ответ:
Использование CRESt позволяет исследователям ускорить открытие новых материалов, оптимизировать рецепты материалов и повысить эффективность активного обучения. Система может автоматически отслеживать эксперименты, обнаруживать проблемы и предлагать решения, что снижает затраты времени и ресурсов на проведение экспериментов.
4. Как система CRESt учитывает человеческий фактор в научных исследованиях?
Ответ:
Исследователи могут общаться с системой на естественном языке, поручать ей использование активного обучения для поиска перспективных рецептов материалов и получать от неё объяснения её действий. CRESt также учитывает результаты экспериментов, отзывы человека и литературные знания для разработки новых экспериментов.
5. Может ли система CRESt заменить человека в научных исследованиях?
Ответ:
CRESt — это помощник, а не замена для исследователей-людей. Исследователи по-прежнему незаменимы в научных исследованиях, особенно на этапе отладки экспериментов и интерпретации результатов. Система помогает исследователям оптимизировать процессы и ускорить открытие новых материалов, но не заменяет их полностью.