Использование вычислений для изучения лучших одноклеточных химиков мира

Сегодня из примерно 1 триллиона видов на Земле 99,999% считаются микробами — бактериями, археями, вирусами и одноклеточными эукариотами. Большую часть истории нашей планеты микробы господствовали на Земле, способные жить и процветать в самых экстремальных условиях. Исследователи только в последние десятилетия начали бороться с разнообразием микробов — считается, что менее 1% известных генов имеют подтверждённые в лаборатории функции. Вычислительные подходы предлагают исследователям возможность стратегически обрабатывать этот поистине поразительный объём информации.

Вопрос: что побудило вас исследовать микробы в экстремальных условиях и с какими проблемами вы сталкиваетесь при их изучении?

Ответ: экстремальные условия — это отличные места для поиска интересной биологии. В детстве я мечтал стать космонавтом, и самое близкое к астробиологии, что есть на Земле, — это изучение экстремальных условий. И единственное, что живёт в таких экстремальных условиях, — это микробы. Во время экспедиции по сбору образцов у побережья Мексики мы обнаружили красочный микробный коврик на глубине около 2 километров под водой, который процветал благодаря тому, что бактерии дышали серой вместо кислорода — но ни один из микробов, которых я надеялся изучить, не размножался в лаборатории.

Основная сложность в изучении микробов заключается в том, что большинство из них невозможно культивировать, а это значит, что единственный способ изучить их биологию — это метод, называемый метагеномикой. Моя последняя работа — это моделирование языковых моделей на уровне генома. Мы надеемся разработать вычислительную систему, чтобы мы могли исследовать организм как можно больше «in silico», используя только данные о последовательностях.

Вопрос: учитывая разнообразие микробов и то, как мало мы о них знаем, как изучение микробов in silico с помощью моделирования языковых моделей генома может продвинуть наше понимание микробного генома?

Ответ: геном состоит из многих миллионов букв. Человек не может всё это рассмотреть и понять. Однако мы можем запрограммировать машину, чтобы она сегментировала данные на полезные части. Именно так работает биоинформатика с одним геномом. Но если вы посмотрите на грамм почвы, который может содержать тысячи уникальных геномов, это слишком большой объём данных — чтобы справиться с ними, нужны и человек, и компьютер.

Во время моей докторской и магистерской учёбы мы только начинали открывать новые геномы и новые линии, которые так отличались от всего, что было охарактеризовано или выращено в лаборатории. Мы называли их «микробной тёмной материей». Когда есть много не охарактеризованных объектов, машинное обучение может быть действительно полезным, потому что мы ищем закономерности. Но это не конечная цель. Мы надеемся сопоставить эти закономерности с эволюционными отношениями между каждым геномом, каждым микробом и каждым проявлением жизни.

Вопрос: как ваши исследования могут быть применены для использования функционального потенциала микробов?

Ответ: микробы, возможно, лучшие химики в мире. Использование микробного метаболизма и биохимии приведёт к более устойчивым и эффективным методам производства новых материалов, новых терапевтических средств и новых типов полимеров.

Но дело не только в эффективности — микробы занимаются химией, о которой мы даже не подозреваем. Понимание того, как работают микробы, и возможность понять их геномный состав и функциональные возможности будут иметь большое значение, когда мы будем думать об изменениях в нашем мире и климате. Большинство процессов связывания углерода и круговорота питательных веществ осуществляется микробами; если мы не поймём, как конкретный микроб способен фиксировать азот или углерод, мы столкнёмся с трудностями при моделировании потоков питательных веществ на Земле.

С терапевтической точки зрения инфекционные заболевания представляют реальную и растущую угрозу. Понимание того, как микробы ведут себя в различных средах по отношению к остальной части нашего микробиома, действительно важно, когда мы думаем о будущем и борьбе с микробными патогенами.

Вопрос: какие методы и подходы используются для изучения микробов, которые невозможно культивировать в лабораторных условиях?

Ответ: для изучения микробов, которые невозможно культивировать в лабораторных условиях, используется метод метагеномики. Это позволяет исследовать микробные сообщества в их естественной среде обитания и анализировать геномные последовательности без необходимости выращивания микроорганизмов в культуре. Кроме того, моделирование языковых моделей на уровне генома и применение вычислительных систем для исследования организмов «in silico» помогают учёным обрабатывать большие объёмы данных и выявлять закономерности в микробных геномах.

Вопрос: какие потенциальные преимущества может принести глубокое понимание микробного генома и его функциональных возможностей в различных областях науки и промышленности?

Ответ: глубокое понимание микробного генома и его функциональных возможностей может привести к разработке более устойчивых и эффективных методов производства новых материалов, терапевтических средств и полимеров. Это также поможет лучше понять процессы связывания углерода и круговорота питательных веществ, осуществляемые микробами, что важно для моделирования потоков питательных веществ на Земле. С терапевтической точки зрения, понимание поведения микробов в различных средах может способствовать разработке новых стратегий борьбы с инфекционными заболеваниями.

Вопрос: как вычислительные подходы и моделирование языковых моделей могут помочь в изучении и понимании микробного генома?

Ответ: вычислительные подходы и моделирование языковых моделей могут помочь в изучении и понимании микробного генома путём обработки больших объёмов данных, полученных из метагеномики и других источников. Эти методы позволяют сегментировать данные на полезные части, выявлять закономерности и сопоставлять их с эволюционными отношениями между микробами. Это способствует более глубокому пониманию микробного генома и его функциональных возможностей.

Источник