Учёный преодолевает ключевое препятствие для ИИ в разработке лекарств

Разработка лекарств — это дорогостоящий и длительный процесс. На ранних стадиях важно выявить соединения высокого качества — те, которые обладают высокой эффективностью, селективностью и благоприятными метаболическими свойствами. Это позволяет снизить затраты и ускорить путь к клиническим испытаниям.

Компьютерное проектирование лекарств

В течение последнего десятилетия учёные используют машинное обучение, чтобы сделать начальный процесс скрининга более эффективным. Компьютерное проектирование лекарств используется для вычислительного скрининга соединений, которые взаимодействуют с целевым белком. Однако способность точно и быстро оценить силу этих взаимодействий остаётся сложной задачей.

Доктор Бенджамин П. Браун, доцент кафедры фармакологии в Школе медицины Vanderbilt University, говорит: «Машинное обучение обещало преодолеть разрыв между точностью проверенных временем физических вычислительных методов и скоростью более простых эмпирических оценочных функций».

Ограничения текущих методов машинного обучения

«К сожалению, его потенциал до сих пор не реализован, поскольку текущие методы машинного обучения могут непредсказуемо давать сбой, когда сталкиваются с химическими структурами, которые не были представлены во время их обучения, что ограничивает их полезность для реальных исследований в области разработки лекарств», — отмечает Браун.

Предложение доктора Брауна

В статье, опубликованной в «Proceedings of the National Academy of Sciences» под названием «A generalizable deep learning framework for structure-based protein-ligand affinity ranking», Браун предлагает целевой подход: вместо обучения на всей трёхмерной структуре белка и молекулы лекарства, он предлагает использовать модель, специально настроенную для изучения только представления пространства их взаимодействия. Это позволяет уловить зависящие от расстояния физико-химические взаимодействия между парами атомов.

Оценка модели

Ключевым аспектом работы Брауна стал разработанный им протокол строгой оценки. «Мы настроили наши тренировочные и тестовые запуски так, чтобы они имитировали реальный сценарий: сможет ли наша модель делать эффективные прогнозы для нового семейства белков, если оно будет обнаружено завтра?», — говорит он.

Для этого он исключил целые надсемейства белков и все связанные с ними химические данные из обучающего набора, создав сложный и реалистичный тест способности модели к обобщению.

Работа Брауна даёт несколько ключевых идей для этой области. Браун, основной преподаватель Центра искусственного интеллекта в динамике белков, знает, что предстоит ещё много работы. Его текущий проект сосредоточен исключительно на оценке — ранжировании соединений по силе их взаимодействия с целевым белком, что является лишь частью уравнения разработки лекарств на основе структуры.

«Моя лаборатория в основном занимается моделированием задач, связанных с масштабируемостью и обобщаемостью в молекулярном моделировании и компьютерном проектировании лекарств. Надеюсь, скоро мы сможем поделиться дополнительной работой, направленной на продвижение этих принципов», — говорит Браун.

На данный момент остаются значительные проблемы, но работа Брауна над созданием более надёжного подхода к машинному обучению в области компьютерного проектирования лекарств на основе структуры прояснила путь вперёд.

Предоставлено Vanderbilt University.

Источник