Под руководством Хуэймин Чжао, профессора химической и биомолекулярной инженерии в Университете Иллинойса в Урбане-Шампейне, исследователи разработали EZSpecificity. Для этого использовались новые данные о парах фермент-субстрат и новый алгоритм машинного обучения. Инструмент стал доступен онлайн, а результаты исследования опубликованы в журнале Nature.
«Если мы хотим получить определённый продукт с помощью фермента, мы хотим использовать наилучшую комбинацию фермента и субстрата», — сказал Чжао, который также является директором лаборатории NSF Molecule Maker Lab Institute и NSF iBioFoundry в Университете Иллинойса. «EZSpecificity — это модель искусственного интеллекта, которая может анализировать последовательность фермента и предсказывать, какой субстрат лучше всего подойдёт к этому ферменту. Она хорошо дополняет модель CLEAN AI, разработанную нами для прогнозирования функции фермента по его последовательности более двух лет назад».
Как работает EZSpecificity
Ферменты — это крупные белки, которые катализируют молекулярные реакции. У них есть карманные области, в которые встраиваются молекулы, называемые субстратами. Насколько хорошо фермент и субстрат подходят друг другу, называется специфичностью. Типичная аналогия для взаимодействия фермент-субстрат — это замок и ключ: только правильный ключ откроет замок. Однако функция фермента не так проста, как это может показаться, — отметил Чжао.
«Сложно определить наилучшую комбинацию, потому что карман не статичен, — сказал он. — Фермент фактически изменяет свою конформацию при взаимодействии с субстратом. Это скорее индуцированное соответствие. А некоторые ферменты неразборчивы и могут катализировать разные типы реакций. Это очень усложняет предсказания. Вот почему нам нужна модель машинного обучения и экспериментальные данные, которые действительно доказывают, какая пара будет работать лучше всего».
Хотя были представлены и другие модели специфичности ферментов, они ограничены в точности и типах ферментативных реакций, которые они могут предсказать.
Группа Чжао поняла, что для улучшения способности ИИ предсказывать специфичность необходимо улучшить и расширить набор данных, на основе которого работает модель машинного обучения. Они сотрудничали с группой под руководством Дивакара Шуклы, профессора химической и биомолекулярной инженерии в Университете Иллинойса. Группа Шуклы провела исследования стыковки для различных классов ферментов, чтобы создать большую базу данных, содержащую информацию не только о последовательности и структуре ферментов, но и о том, как ферменты различных классов взаимодействуют с различными типами субстратов.
«Эксперименты, фиксирующие взаимодействие ферментов с их субстратами, часто бывают медленными и сложными, поэтому мы провели обширные симуляции стыковки, чтобы дополнить и расширить существующие экспериментальные данные», — сказал Шукла. «Мы сосредоточились на взаимодействиях между ферментами и их субстратами на атомном уровне. Миллионы расчётов стыковки предоставили нам недостающий элемент головоломки для создания высокоточного предсказателя специфичности ферментов».
Исследователи протестировали EZSpecificity в сравнении с ESP, текущей лидирующей моделью, в четырёх сценариях, имитирующих реальные условия. EZSpecificity превзошла ESP во всех сценариях. Наконец, исследователи экспериментально подтвердили эффективность EZSpecificity, изучив восемь ферментов-галогеназ, класс, который ещё недостаточно изучен, но всё чаще используется для создания биологически активных молекул, и 78 субстратов. EZSpecificity достигла точности 91,7% для своих лучших прогнозов пар, в то время как ESP показала точность только 58,3%.
«Я не могу сказать, что это работает для каждого фермента, но для определённых ферментов мы показали, что EZSpecificity действительно работает очень хорошо», — сказал Чжао. «Мы хотим сделать этот инструмент доступным для других, поэтому разработали пользовательский интерфейс. Исследователи теперь могут ввести субстрат и последовательность белка, а затем использовать наш инструмент для прогнозирования того, будет ли этот субстрат работать хорошо или нет».
Далее исследователи планируют расширить свои инструменты ИИ для анализа селективности ферментов, чтобы определить, предпочитает ли фермент определённый сайт на субстрате, и таким образом исключить ферменты с побочными эффектами. Они также планируют продолжать совершенствовать EZSpecificity, используя больше экспериментальных данных.
Предоставлено Университетом Иллинойса в Урбане-Шампейне.