Новая шкала биологии: массивы данных помогают в борьбе со сверхбактериями

Искусственный интеллект полагается на алгоритмы машинного обучения, обученные на массивах данных, чтобы делать прогнозы — представьте, как ChatGPT изучил язык, поглощая информацию из интернета. Однако в биологии учёные сталкиваются с разочаровывающей проблемой — высококачественные массивы данных, необходимые для обучения мощных моделей искусственного интеллекта, встречаются редко. Без таких массивов данных мы не сможем использовать машинное обучение для решения самых насущных проблем здравоохранения.

Калин Плеса, доцент кафедры биоинженерии в кампусе Университета Орегона имени Фила и Пенни Найт для ускорения научного воздействия, увидел возможность изменить ситуацию. Его лаборатория специализируется на масштабировании синтетической биологии, переходя от работы с отдельными биологическими компонентами к созданию целых систем, которые на порядки крупнее. Цель — создать массивные, высококачественные биологические массивы данных, которые могли бы обучать системы машинного обучения для борьбы с раком, ускорения разработки лекарств и повышения устойчивости к болезням.

В исследовании, опубликованном в Science Advances, Плеса и его команда продемонстрировали, как это может работать, нацелившись на одну из самых насущных угроз в медицине: устойчивые к антибиотикам сверхбактерии.

«Мы, по сути, пытаемся увеличить объём биологической информации», — говорит Плеса. «Сейчас, если вы хотите понять, как ген работает у разных видов, вы можете протестировать, возможно, десять или двадцать различных версий в традиционной лабораторной установке. Нас интересует тестирование тысяч одновременно».

Ключ к созданию этих огромных массивов данных — инновационная технология DropSynth от Плесы, которая может одновременно создавать тысячи генов, последовательностей ДНК, служащих биологическими инструкциями для определённых признаков и характеристик. Традиционно создание генов в лаборатории было медленным и кропотливым процессом, но DropSynth изменил это полностью.

Технология работает путём упаковки всего молекулярного механизма, необходимого для создания гена, в микроскопические капли масла. Каждая капля становится крошечной биологической фабрикой, которая собирает и усиливает уникальный ген. В каждой пробирке могут быть сотни или тысячи таких микроскопических капель масла, что позволяет одновременно производить сотни или тысячи генов. Примечательно, что всё это происходит в одной пробирке, что значительно ускоряет процесс создания обширных библиотек генов.

Когда Плеса впервые представил DropSynth в 2018 году, он знал, что у неё есть большой потенциал. Но ему нужны были сотрудники, чтобы помочь решить реальные биологические задачи. Этот опыт пришёл к нему через доктора Сиян Лам, научного сотрудника кампуса, Кармен Резник и постдокторанта с опытом работы в области микробной экологии, Карла Романовича.

Вместе лаборатория Плесы нацелилась на одну из самых насущных угроз в современной медицине: устойчивость к противомикробным препаратам. Это происходит, когда бактерии эволюционируют, чтобы противостоять антибиотикам, создавая «сверхбактерии», которые могут уклоняться от нашего текущего арсенала лекарств и методов лечения. Только в 2021 году устойчивость к противомикробным препаратам унесла жизни примерно 1,14 миллиона человек во всём мире, согласно отчёту, опубликованному в The Lancet.

Традиционные подходы к изучению устойчивости к противомикробным препаратам разочаровывают своей ограниченностью. Исследователи обычно постепенно подвергают бактерии воздействию антибиотиков и анализируют выживших, что является медленным процессом, ограниченным видами, которые хорошо растут в лабораторных условиях, и трудно масштабируемым.

Романович, Резник и Плеса представили себе нечто иное. Что, если бы они могли использовать DropSynth для одновременного создания тысяч вариантов генов бактерий, предоставив беспрецедентное понимание того, как развивается устойчивость?

В своей последней публикации команда разработала простой редукционистский подход к изучению устойчивости к противомикробным препаратам в масштабе. Вместо того чтобы пытаться решить логистический кошмар выращивания тысяч различных видов бактерий, они сосредоточились на одном гене, который служит общим знаменателем в устойчивости к антибиотикам: DHFR (дигидрофолатредуктаза).

DHFR — это важный фермент, необходимый бактериям для производства фолатов и деления клеток, и он является частой мишенью антибиотиков. Команда сосредоточилась на создании генов DHFR из широкого спектра бактерий (включая многие, которые обычно не изучаются в лабораториях) и вставила их одну за другой в E. coli, вид, который процветает в лабораторных условиях.

Ключом стало использование специально разработанного штамма E. coli, у которого отсутствует собственный ген DHFR. Это сделало выживание бактерий полностью зависимым от того, сможет ли введённый вариант гена DHFR восстановить типичную функцию DHFR по синтезу фолатов. Эта продуманная система позволила исследователям протестировать сотни различных вариантов гена DHFR из разных ветвей бактериальной эволюции в рамках согласованной, контролируемой экспериментальной установки.

Используя DropSynth, Резник под руководством менеджера лаборатории Сэмюэля Хинтона создала более 1500 версий гена DHFR, включая варианты из знакомых патогенов, таких как стафилококк (Staphylococcus aureus) и холера (Vibrio cholerae). Благодаря включению такого широкого эволюционного разнообразия они надеялись выяснить, как различные версии DHFR различаются по своей способности противостоять антибиотикам, и есть ли у некоторых общие уязвимости.

Результаты принесли немедленное удивление: многие варианты DHFR от отдалённых бактериальных родственников функционировали совершенно нормально в их системе тестирования E. coli.

«Мы были потрясены тем, сколько последовательностей оказались практически функциональными при подключении к E. coli, и что всё это работало так хорошо. Это стало своего рода «подключи и работай» со всеми этими вариантами DHFR», — сказал Плеса.

Далее последовал решающий тест. Исследователи подвергли свою библиотеку генетически модифицированных бактерий воздействию различных концентраций триметоприма, антибиотика, который специально нацелен на DHFR. Результаты нарисовали подробную картину устойчивости: некоторые варианты DHFR были высокочувствительны к препарату, в то время как другие оставались устойчивыми даже при высоких дозах.

Используя передовые вычислительные подходы, разработанные Романовичем, команда смогла определить, какие области DHFR склонны к развитию устойчивости, а какие остаются уязвимыми для антибиотиков. Поскольку их библиотека представляла такое широкое эволюционное разнообразие, анализ Романовича смог выявить, как устойчивость формируется под влиянием мутаций и эволюционного фона.

Когда они проанализировали несколько известных вариантов DHFR, уже связанных с клинической устойчивостью к антибиотикам, они обнаружили, что эти версии сохраняли свою устойчивость в течение значительно более длительных периодов.

Такой детальный анализ может революционизировать разработку антибиотиков нового поколения, указывая исследователям на молекулярные «слабые места» в бактериальных генах, одновременно отмечая варианты, которые могут быть предрасположены к устойчивости.

«Поскольку устойчивость к противомикробным препаратам продолжает расти, наша способность изучать функцию генов у тысяч видов микробов представляет собой не просто захватывающее научное достижение, это может стать критически важным инструментом в нашей постоянной борьбе со сверхбактериями», — говорит Романович, соавтор публикации.

Лаборатория Плесы уже работает над интеграцией этого массивного набора данных DHFR в алгоритмы машинного обучения, которые в конечном итоге смогут предсказывать устойчивость до её появления в клинических условиях.

Для Плесы этот проект представляет собой именно тот вид масштабируемого биологического понимания, который он задумал при создании DropSynth. Хотя это исследование было сосредоточено на DHFR и устойчивости к антибиотикам, последствия выходят далеко за рамки борьбы со сверхбактериями.

«Используя DropSynth, мы впервые смогли увеличить масштаб и создать большие библиотеки генов и применить их к устойчивости к противомикробным препаратам. Это было доказательством принципа, но мы могли бы сделать это практически для чего угодно в биологии», — говорит Плеса.

Тот же подход можно использовать для изучения генов, связанных с раком, картирования вирусной эволюции или разработки совершенно новых ферментов и белков. Более того, Плеса и его команда рассматривают DropSynth как инструмент для создания массивов данных, необходимых для обучения высококачественных алгоритмов машинного обучения, которые помогут исследователям решать сложные задачи в области биологии.

Эта технология уже быстро развивается для коммерческого использования. Плеса основал SynPlexity, стартап-компанию, базирующуюся в Центре инноваций кампуса Knight Papé. Компания работает над коммерциализацией DropSynth и более широким распространением крупномасштабных наборов данных в области синтетической биологии.

Хотя это исследование было сосредоточено на одном гене, оно служит мощным доказательством концепции с огромным потенциалом. От понимания эволюции до разработки новых белков — сочетание синтетической биологии и машинного обучения открывает новые горизонты в нашей борьбе с некоторыми из самых серьёзных проблем здравоохранения человечества.

Предоставлено: Университет Орегона.

Источник

Другие новости по теме

Другие новости на сайте