Изучение языка лассо-пептидов для улучшения пептидной инженерии

В поисках новых терапевтических средств против рака и инфекционных заболеваний лассо-пептиды показывают себя перспективным направлением. Их узловая структура обеспечивает высокую стабильность и разнообразную биологическую активность, что делает их многообещающими кандидатами для создания новых лекарственных препаратов.

Чтобы лучше раскрыть их клинический потенциал, группа из Института геномной биологии имени Карла Р. Вёзе разработала LassoESM — новую большую языковую модель для прогнозирования свойств лассо-пептидов.

Совместное исследование опубликовано в Nature Communications

Лассо-пептиды — это природные продукты, производимые бактериями. Для их создания бактерии используют рибосомы для сборки цепочек аминокислот, которые затем складываются биосинтетическими ферментами в уникальную структуру, напоминающую скользящий узел. В результате образуются тысячи различных лассо-пептидов, многие из которых демонстрируют антибактериальные, противовирусные и противоопухолевые свойства.

«Существуют поразительные возможности использования лассо-пептидов в открытии лекарств, от нацеливания на рецепторы до разработки стабильных пероральных лекарственных препаратов», — сказал Дуг Митчелл, директор Института химической биологии Вандербильта и соруководитель исследования. «Создав специализированную языковую модель для этих молекул, мы создали инструмент, который помогает нам реализовать эти возможности гораздо более эффективно».

Модели машинного обучения для распознавания закономерностей в больших наборах данных

Модели машинного обучения стали важными инструментами для исследователей, особенно для распознавания закономерностей в больших наборах данных. Это позволяет учёным находить новые связи, экономя при этом месяцы времени и усилий. Прогнозирование белков особенно выигрывает от этой технологии, помогая раскрыть новые идеи о сложных взаимодействиях белков и ускорить поиск новых терапевтических средств. Однако общепринятые платформы искусственного интеллекта для прогнозирования белков, такие как AlphaFold, не справляются с лассо-пептидами.

«Из-за уникальной структуры лассо-пептида ни одна из нынешних программ искусственного интеллекта на самом деле не работает с точки зрения прогнозирования структуры», — сказал соруководитель проекта Дивакар Шукла (BSD/CAMBERS/MMG), профессор химической и биомолекулярной инженерии и профессорский учёный Джеймса У. Уэстветера в Университете Иллинойса в Урбане-Шампейне.

Языковые модели для белков

Подобно большим языковым моделям, лежащим в основе чат-ботов с искусственным интеллектом, белковые языковые модели обучаются изучать и применять язык белков: их аминокислотные последовательности, трёхмерные структуры и взаимодействия с окружающей средой. Но без специфических для лассо-пептидов обучающих данных эти алгоритмы не обладают специфичностью для этих молекул.

«Прогнозирование свойств лассо-пептидов было сложной задачей из-за нехватки экспериментально маркированных данных и сложности взаимодействий между ферментами и пептидными субстратами», — сказала Сюэнан Ми, недавно защитившая докторскую диссертацию в исследовательской группе Шуклы. «Мы разработали LassoESM, специализированную для лассо-пептидов белковую языковую модель, чтобы учесть особенности пептидов, которые часто упускаются из виду общими белковыми языковыми моделями».

Группа Митчелла сначала использовала методы биоинформатики для поиска тысяч последовательностей лассо-пептидов, которые производят различные микроорганизмы. Чтобы улучшить качество данных, команда также вручную проверила все новые последовательности лассо-пептидов, которые они обнаружили.

«Затем мы изучили язык этих лассо-пептидов, используя моделирование замаскированного языка, когда вы скрываете часть пептида, а затем пытаетесь предсказать другую половину», — сказал Шукла. «Как только вы изучите язык формирования лассо-структуры в природе, вы сможете обучить эффективные модели прогнозирования свойств на основе параметров языковой модели».

Объединив знания группы Шуклы в области машинного обучения с экспериментальными данными, собранными группой Митчелла, команда применила LassoESM для решения множества полезных задач прогнозирования. Одним из направлений является идентификация совместимых пар лассо-пептидов и лассо-циклаз для расширения клинического потенциала этих молекул. Лассо-циклазы — это ферменты, ответственные за этап формирования узла при биосинтезе лассо-пептидов.

«Мы создали модели для прогнозирования того, какая лассо-циклаза может фактически сформировать лассо-пептид, используя только последовательность аминокислот в пептиде. Если мы сможем понять диапазон субстратов или разработать лассо-циклазы, мы потенциально сможем превратить любой пептид в лассо», — сказал Шукла.

Ми сказала: «Мы продемонстрировали, что LassoESM позволяет точно прогнозировать различные свойства лассо-пептидов даже при ограниченном объёме обучающих данных. Эта работа предоставляет мощный инструмент на основе искусственного интеллекта для ускорения рационального проектирования функциональных лассо-пептидов для биомедицинского и промышленного применения».

В дальнейшем команда также стремится расширить свою модель, чтобы включить новые возможности прогнозирования, такие как создание специализированных языковых моделей для других пептидных природных продуктов и разработка лассо-пептидов для нацеливания на конкретные белки.

Источник

Другие новости по теме

Другие новости на сайте