Понимание того, как молекулы взаимодействуют друг с другом, имеет центральное значение для биологии: от расшифровки функционирования живых организмов до выявления механизмов заболеваний и разработки жизненно важных лекарств. В последние годы такие модели, как AlphaFold, изменили наши возможности в предсказании трёхмерной структуры белков, предоставляя важную информацию об их форме и взаимодействии.
Однако, хотя AlphaFold могла показать, как молекулы соединяются друг с другом, она не могла измерить, насколько сильно они связываются — ключевой фактор в понимании всех вышеупомянутых свойств. Именно здесь на помощь приходит новая модель ИИ от MIT — Boltz-2.
Boltz-2: новый шаг в моделировании структуры и аффинности связывания
Boltz-2 открывает новые горизонты, совместно моделируя структуру и аффинность связывания — критический параметр в открытии малых молекул лекарств. Модуль аффинности Boltz-2 был обучен на миллионах реальных лабораторных измерений, показывающих, насколько сильно различные молекулы связываются с белками. Благодаря этому Boltz-2 может теперь предсказывать силу связывания с беспрецедентной точностью по нескольким контрольным показателям, отражающим различные этапы реального открытия лекарств.
В установленных контрольных показателях прогнозы Boltz-2 очень близки к тем, которые производятся с помощью полнофизических расчётов свободной энергии (точное компьютерное моделирование, предсказывающее, насколько сильно лекарство связывается с его мишенью, но для проведения одного теста даже на GPU может потребоваться до суток). При этом Boltz-2 работает более чем в 1000 раз быстрее. Это первая модель глубокого обучения, которая достигла такого уровня точности.
«Это увеличение производительности делает Boltz-2 не просто исследовательским инструментом, но и практическим двигателем для реального развития лекарств», — говорит аспирант MIT CSAIL Габриэле Корсо. Корсо вместе с сокурсником Джереми Вольвендендом и исследователем клиники Jameel MIT Саро Пассаро был ведущим исследователем как Boltz-1, так и Boltz-2.
«Вместо того чтобы тратить часы на моделирование взаимодействия между одной молекулой и её мишенью, учёные теперь могут за тот же промежуток времени провести скрининг обширных химических библиотек, что позволяет командам на ранних стадиях работы определять приоритеты только для наиболее перспективных соединений для лабораторных испытаний».
Открытый исходный код Boltz-2
Boltz-2 будет выпущен как полностью открытый исходный код под лицензией MIT, включая код модели, веса и обучающие данные.
В начале 2023 года команда исследователей из лаборатории компьютерных наук и искусственного интеллекта MIT (CSAIL) и клиники Jameel Clinic для машинного обучения в здравоохранении (Jameel Clinic) запустила амбициозный эксперимент: может ли модель машинного обучения не только предсказывать молекулярные структуры, но и понимать, как ведут себя биомолекулы — как они взаимодействуют и, что наиболее важно, насколько вероятно их связывание — ключевой механизм в открытии лекарств.
В основе многих заболеваний лежат нарушения регуляции биомолекулярных функций. Это можно смягчить, разрабатывая молекулы, которые могут связываться с вовлечёнными мишенями. Точное прогнозирование такого поведения связывания является одной из самых больших задач при разработке эффективных новых лекарств.
В 2024 году этот проект стал известен как Boltz-1 — модель с открытым исходным кодом, разработанная как быстрая и доступная альтернатива AlphaFold3 — современному методу в этой области. С момента своего выпуска Boltz-1 использовался тысячами учёных в ведущих академических лабораториях, биотехнологических компаниях и фармацевтических компаниях, что сделало его наиболее широко используемой моделью такого рода в отрасли.
Теперь та же команда, работая с биотехнологической компанией Recursion, представила следующий шаг: Boltz-2 — значительный прогресс в молекулярном моделировании на основе ИИ.
Boltz-2 улучшает Boltz-1 по нескольким ключевым направлениям. Модель была переобучена с использованием гораздо большего и разнообразного набора данных, включая компьютерные симуляции молекул в движении и синтетические данные, полученные из прогнозов более ранней версии модели. Он также добавляет новую функцию под названием Boltz-Steering, которая помогает точно настраивать результаты, используя физические подсказки для того, чтобы сделать предсказанные структуры более реалистичными.
Помимо производительности, Boltz-2 разработан с учётом удобства использования. Модель может управляться с помощью реальных экспериментальных данных, примеров структур или предпочтений пользователя, предоставляя исследователям больше контроля для адаптации результатов к тому, что они уже знают, или к тому, что они пытаются проверить.
«Этот выпуск особенно важен для области открытия малых молекул лекарств, где прогресс отставал от быстрых достижений, наблюдаемых в области биологических препаратов и белковой инженерии», — говорит Пассаро. «Хотя такие модели, как AlphaFold и Boltz-1, позволили значительно продвинуться в вычислительном проектировании антител и белковых терапевтических средств, мы не видели аналогичного улучшения в нашей способности проводить скрининг малых молекул, которые составляют большинство лекарств в мировом конвейере».
«Boltz-2 напрямую устраняет этот пробел, предоставляя точные прогнозы аффинности связывания, которые могут значительно сократить затраты и время на раннюю стадию скрининга».
Пассаро и Корсо работали над Boltz-2 вместе с профессорами MIT и главными исследователями CSAIL Региной Барзилай и Томми Яакколой, Вольвендендом и командой исследователей из MIT и Recursion.
Предоставлено:
Массачусетский технологический институт.