В интервью Гейб Гомеш обсуждает потенциал объединения человеческого творчества и возможностей машин для преобразования химических исследований.
«Существует распространённое заблуждение, что использование больших языковых моделей (LLM) в исследованиях сродни обращению к оракулу за ответом. Реальность такова, что ничего не работает подобным образом», — говорит Гейб Гомеш.
Гейб Гомеш, доцент кафедры химического машиностроения и химии в Университете Карнеги-Меллона, считает, что большие языковые модели могут трансформировать химические исследования, если их использовать продуманно. В журнале Nature Computational Science Гомеш и его соавторы предлагают дорожную карту для более стратегического внедрения LLM.
Текущее состояние химических исследований
Текущее состояние химических исследований обычно разделено на компьютерное моделирование и лабораторные эксперименты. Учёные могут тратить месяцы, используя компьютеры для прогнозирования того, как молекулу можно создать и как она будет вести себя. Другие учёные могут тратить месяцы в лаборатории, фактически создавая и тестируя эту молекулу. Эти два подхода плохо интегрированы.
«Именно здесь большие языковые модели становятся интересными», — говорит Роберт Макнайт, доктор философии в области химического машиностроения. LLM обладают потенциалом для устранения разрозненности между компьютерными прогнозами и тестированием в реальных условиях, что в конечном итоге ускоряет открытия.
Роль исследователя в эпоху больших языковых моделей
В 2023 году Гомеш и его исследовательская группа опубликовали Coscientist, систему на основе LLM, которая может автономно планировать, проектировать и проводить сложные научные эксперименты. По мере того как LLM всё чаще внедряются в научные исследования, Гомеш видит, что роль исследователя смещается в сторону более высокого уровня мышления: определения исследовательских вопросов, интерпретации результатов в более широком научном контексте и совершения творческих скачков, которые искусственный интеллект (ИИ) совершить не может. Вместо того чтобы заменять человеческое творчество и интуицию, системы ИИ могут усилить нашу способность систематически исследовать химическое пространство.
Потенциал и ограничения больших языковых моделей в химии
Потенциал LLM в химии:
* Ускорение сбора данных. Разработка Coscientist показала, что LLM имеют огромный потенциал для ускорения темпа химических исследований, особенно в сборе данных.
* Планирование экспериментов. LLM могут помочь исследователям ориентироваться в обширной литературе, извлекать релевантную информацию и выявлять пробелы в исследованиях или противоречия между статьями. Они также демонстрируют большой потенциал для планирования задач, включая проектирование экспериментов и генерацию проверяемых гипотез.
* Автоматизация. LLM могут переводить между естественным языком и языками программирования. Другими словами, они могут взять английское описание эксперимента и преобразовать его в исполняемый код, упрощая управление лабораторным оборудованием и облачными лабораториями.
Ограничения LLM в химии:
* Безопасность. Галлюцинации в химии могут быть опасны. Если LLM предлагает смешать несовместимые химические вещества или предоставляет неверные процедуры синтеза, это может привести к серьёзным рискам для безопасности или окружающей среды.
* Технические языки. В химии есть очень специфические технические языки, с которыми общие LLM борются.
* Точность. Химия требует точных численных рассуждений, а LLM не всегда хороши в этом. Небольшая ошибка в молекулярном представлении или спектральной интерпретации может полностью изменить результат.
* Мультимодальность. Химические исследования по своей сути мультимодальны. Мы работаем с текстовыми процедурами, молекулярными структурами, спектральными изображениями и экспериментальными данными одновременно. Поскольку большинство LLM в основном текстовые, включение всех этих типов химической информации является сложной задачей.
Заключение
Для обеспечения реального прогресса в химических исследованиях необходимо разработать методы оценки, демонстрирующие надёжность и достоверность этих систем. Текущие оценки часто тестируют только извлечение знаний. Существует потребность в оценке логических способностей, необходимых для реальных исследований.