Модели машинного обучения проникают в нашу жизнь, помогая в решении различных задач — от составления плейлистов до объяснения сложных концепций за несколько секунд. Современные алгоритмы становятся мощным инструментом в современной медицине.
В исследовании, опубликованном в журнале Cell Systems, учёные из Стэнфорда используют машинное обучение для повышения эффективности и безопасности целенаправленной клеточной и генной терапии. Они стремятся использовать собственные белки человека для создания новых терапевтических решений.
Большинство заболеваний человека возникает из-за нарушения работы белков в организме. Введение нового терапевтического белка для исправления неисправного — это идеальный вариант. Однако для других терапевтических белков, особенно тех, которые действуют в клетках, таких как CAR-T и CRISPR-терапия, до сих пор не было аналогичного подхода.
Исследователи из лаборатории Gao обратились к моделям машинного обучения, чтобы решить эту проблему. Они пытаются предсказать, какие изменения в белке могут вызвать иммунный ответ, и разрабатывать конструкции, которые с меньшей вероятностью будут отвергнуты организмом.
Объединив три независимых алгоритма машинного обучения, команда добилась значительного прогресса в создании инструмента для эффективного проектирования белков, которые избегают проблем с иммунным ответом и сохраняют свою функциональность при введении в организм человека.
Одним из способов снижения иммунных реакций на эти терапевтические средства является использование белков, которые уже существуют в организме человека. Команда Gao выбрала небольшие белки, называемые «цинковыми пальцами», которые являются одними из наиболее распространённых белков в эукариотических организмах и отвечают за регуляцию экспрессии генов.
Благодаря способности естественным образом связываться с ДНК человека, они являются хорошей альтернативой существующим технологиям, таким как CRISPR, которая с большей вероятностью вызовет иммунные реакции, поскольку происходит от бактерий.
«Наиболее значительной частью нашей работы является прогресс в разработке ДНК-связывающих доменов «цинковых пальцев», которые могут нацеливаться на любой выбранный нами геномный сайт, сохраняя при этом низкий прогнозируемый риск запуска иммунных ответов», — сказал Эрик Волсберд, доктор философии, студент химического машиностроения и ведущий автор статьи.
Команда использовала первый алгоритм для предсказания новых мишеней ДНК, таких как вызывающие заболевание гены, которые могут связываться с комбинациями «цинковых пальцев». Поскольку «цинковые пальцы» обычно соединяются вместе для распознавания более длинных участков ДНК, команда собрала их в массивы, создав новые соединения между отдельными единицами «цинковых пальцев».
Однако возникла сложность: «Эти соединения неестественны, они не встречаются в нашем организме», — сказала Гао. «Это означало, что иммунная система могла распознать их как чужеродные и отреагировать».
Затем команда использовала второй алгоритм машинного обучения, MARIA, разработанный соавторами статьи Бинбином Ченом, бывшим аспирантом Стэнфорда, и Эшем Ализадехом, профессором медицины в Школе медицины. MARIA была разработана для прогнозирования иммуногенности этих соединений цинковых белков при создании противораковых вакцин.
Команда стремилась к тому, чтобы вакцина была высокоиммуногенной, поэтому использовала MARIA в обратном порядке для отбора соединений или мутаций, которые позволили бы избежать обнаружения иммунной системой. Если MARIA предсказывала, что сконструированные «цинковые пальцы» вряд ли будут обнаружены иммунной системой, конструкция считалась более безопасной.
Хотя комбинация этих двух моделей действительно позволила получить функциональные массивы «цинковых пальцев», они показали ограниченную эффективность, вероятно, из-за ограничений алгоритмов, используемых для прогнозирования последовательностей связывания «цинковых пальцев».
Чтобы сохранить пониженную иммуногенность и ещё больше улучшить функциональность сконструированных «цинковых пальцев», команда применила свой третий алгоритм: мощную модель белкового языка под названием ESM-IF1. Опираясь на обучение на миллионах естественных последовательностей белков, ESM-IF1 действовал как опытный редактор, предлагая с высоким успехом, какие однобуквенные генетические изменения улучшат производительность «цинкового пальца».
«В прошлом исследователи пытались вносить случайные мутации для улучшения «цинковых пальцев», но это было медленно и неэффективно, а также несовместимо с фильтрацией MARIA», — сказала Гао. «С помощью этой языковой модели мы могли сосредоточиться на умных, целенаправленных изменениях».
После предложения потенциальных мутаций с помощью ESM-IF1 команда ещё раз пропустила модифицированные последовательности через MARIA, чтобы убедиться, что изменения не приведут к появлению новых иммуногенных свойств. «Мы продвигались только с мутациями, которые прошли оба теста — высокая функциональность и низкая иммуногенность», — сказала Гао.