Одной из общих фундаментальных целей большинства исследователей в области химии является необходимость прогнозирования свойств молекул, таких как температура кипения или плавления. Как только исследователи могут точно спрогнозировать эти параметры, они могут продолжить свою работу, что приводит к открытиям, которые ведут к созданию лекарств, материалов и многому другому. Однако исторически традиционные методы получения этих прогнозов связаны со значительными затратами — тратой времени и износом оборудования, помимо финансовых затрат.
На помощь приходит ветвь искусственного интеллекта, известная как машинное обучение (МО). МО в определённой степени облегчило задачу прогнозирования свойств молекул, но передовые инструменты, которые наиболее эффективно ускоряют процесс — обучаясь на существующих данных для быстрого прогнозирования свойств новых молекул — требуют от пользователя значительного уровня знаний в области программирования. Это создаёт барьер доступности для многих химиков, у которых может не быть необходимых вычислительных навыков для работы с алгоритмами прогнозирования.
Чтобы решить эту проблему, исследователи из исследовательской группы МакГуайра в Массачусетском технологическом институте создали ChemXploreML — удобное настольное приложение, которое помогает химикам делать эти важные прогнозы, не требуя глубоких знаний в программировании.
ChemXploreML — это бесплатное, простое в загрузке и функциональное на основных платформах приложение, которое также может работать полностью в автономном режиме, что помогает сохранить конфиденциальность исследовательских данных.
Технология описана в статье, опубликованной в журнале Journal of Chemical Information and Modeling.
Одним из конкретных препятствий в химическом машинном обучении является перевод молекулярных структур на числовой язык, понятный компьютерам. ChemXploreML автоматизирует этот сложный процесс с помощью мощных встроенных «молекулярных встраивателей», которые преобразуют химические структуры в информативные числовые векторы. Затем программное обеспечение реализует современные алгоритмы для выявления закономерностей и точного прогнозирования свойств молекул, таких как температура кипения и плавления, через интуитивно понятный интерактивный графический интерфейс.
«Цель ChemXploreML — сделать машинное обучение в химических науках более доступным», — говорит Аравинд Нивас Маримутху, постдок в группе МакГуайра и ведущий автор статьи. «Создавая интуитивно понятное, мощное и работающее в автономном режиме настольное приложение, мы предоставляем передовые методы прогнозного моделирования непосредственно в руки химиков, независимо от их опыта в программировании. Эта работа не только ускоряет поиск новых лекарств и материалов, делая процесс скрининга быстрее и дешевле, но и гибкая конструкция приложения открывает двери для будущих инноваций».
ChemXploreML разработан с учётом возможности развития со временем, поэтому по мере разработки будущих методов и алгоритмов их можно будет легко интегрировать в приложение, гарантируя, что исследователи всегда смогут получить доступ к самым современным методам и реализовать их.
Приложение было протестировано на пяти ключевых молекулярных свойствах органических соединений — температуре плавления, температуре кипения, давлении пара, критической температуре и критическом давлении — и достигло высокой точности до 93% для критической температуры.
Исследователи также продемонстрировали, что новый, более компактный метод представления молекул (VICGAE) был почти таким же точным, как стандартные методы, такие как Mol2Vec, но был в 10 раз быстрее.
«Мы представляем будущее, в котором любой исследователь сможет легко настраивать и применять машинное обучение для решения уникальных задач, от разработки устойчивых материалов до исследования сложной химии межзвёздного пространства», — говорит Маримутху.
Старший автор и доцент химии, ассистент профессора развития карьеры класса 1943 года Бретт МакГуайр присоединился к нему в работе над статьёй.
Предоставлено Массачусетским технологическим институтом.