Новый метод отслеживает изменения в экспрессии генов, чтобы раскрыть решения о судьбе клеток

Практически все клетки в организме имеют одинаковый генетический план, или геном, но набор генов, которые активно экспрессируются в определённый момент времени, определяет тип клетки и её функцию. Скорость изменения экспрессии генов в одной клетке со временем может дать представление о том, как клетки могут становиться более специализированными. Однако существующие методы измерения ограничены.

Исследователи из Пенсильванского государственного университета и Йельского университета разработали новый метод, который учитывает пространственную информацию о клетке, а также данные о клетках, обработанных в разное время. Это улучшает способность исследователей понимать нюансы изменений в экспрессии генов.

Описание метода

Статья, описывающая метод, под названием spVelo, опубликована в журнале Genome Biology. Метод рассчитывает скорость РНК, которая описывает направление и скорость изменений во время транскрипции — этапа экспрессии генов, включающего копирование генетического кода.

«Различные наборы генов экспрессируются в клетке, когда они активированы, когда они реагируют на стимулы и во время процесса дифференцировки, который позволяет клеткам развиваться в определённые типы клеток», — сказал Вэньсинь Лонг, докторант по статистике в Колледже наук Пенсильванского государственного университета и автор статьи. «Скорость экспрессии РНК стала способом измерения того, как изменяется скорость экспрессии генов в клетке, что может рассказать нам важную информацию о текущем состоянии клетки и её будущем».

Процесс экспрессии генов

Во время экспрессии генов ДНК сначала транскрибируется в матричную РНК (мРНК), которая несёт генетический код, который будет использован для создания белков. Но не вся последовательность мРНК используется; она должна сначала пройти через процесс, называемый сплайсингом, который удаляет сегменты, называемые интронами, которые не несут кодирующей информации, и сращивает обратно вместе экзоны, которые это делают. Сплайсированные мРНК затем могут быть переведены в последовательность белка.

Используя технику, называемую секвенированием РНК отдельных клеток (scRNA-seq), исследователи могут подсчитывать количество нитей РНК, которые были сплайсированы, и тех, которые ещё не были сплайсированы. Моделируя взаимосвязь между сплайсированной и несплайсированной РНК, исследователи делают вывод о том, регулируется ли ген и регулируется ли он.

Исследователи сказали, что эта скорость изменения сплайсированной экспрессии — скорость РНК — по сути, является снимком генов, которые активно включаются или выключаются в клетке, и может быть использована для прогнозирования будущей экспрессии генов.

Преимущества нового метода

«Исследователь может секвенировать РНК из многих клеток одновременно, но клетки, обработанные позднее или разными людьми или исследовательскими группами, могут испытывать слегка отличающиеся лабораторные условия, которые могут повлиять на результаты», — сказал Лонг. «Было сложно объединить несколько партий в одном анализе. Наш метод может учитывать различия между партиями, поэтому мы можем интегрировать гораздо больший объём данных в одном анализе».

В дополнение к обработке нескольких партий одновременно, spVelo учитывает важную пространственную информацию о клетке, сказал Лонг.

«Новые типы данных секвенирования могут предоставить пространственную информацию, например, где клетка расположена в ткани», — сказал Линчжоу Сюэ, профессор статистики в Колледже наук Пенсильванского государственного университета и соавтор статьи. «Некоторые предыдущие методы расчёта скорости РНК могли учитывать либо пространственную информацию, либо несколько партий, но не то и другое вместе. Сочетание этих двух факторов позволяет нам извлечь максимальную информацию из крупномасштабных пространственных наборов данных с несколькими партиями».

Новый метод использует два типа нейронных сетей — тип машинного обучения — для преодоления предыдущих ограничений. Одна из этих нейронных сетей, называемая вариационным автоэнкодером, моделирует экспрессию генов. Вторая нейронная сеть, называемая графовой сетью внимания, позволяет исследователям учитывать пространственную и пакетную информацию из данных секвенирования.

Исследователи сравнили spVelo с различными предыдущими методами, используя набор данных об экспрессии генов при плоскоклеточном раке полости рта, типе рака, а также смоделированный пространственный набор данных клеток поджелудочной железы, который обычно используется исследователями для тестирования и сравнения методов. Исследователи сказали, что spVelo работает так же хорошо или лучше по ряду параметров.

«Ещё одним преимуществом нашего метода является то, что он даёт нам меру уверенности в наших прогнозах, чего не было у предыдущих методов», — сказал Лонг. «Например, мы вполне уверены, что некоторые клетки останутся в определённом типе клеток или перейдут в него, в то время как у других может быть больше возможностей для перехода».

Исследователи сказали, что метод также может быть использован для изучения регуляторных сетей генов. Например, чтобы понять влияние конкретного гена на судьбу клетки, исследователи могут сравнить скорости РНК в нормальной клетке и в клетке, где этот ген был удалён.

«Скорость РНК всё ещё является новой концепцией, и мы считаем, что существует множество приложений», — сказал Сюэ. «Наличие более надёжного способа измерения нескольких партий и учёта пространственных данных открывает новые возможности, и мы рады видеть, как наш метод будет использоваться в будущем».

В дополнение к Лонгу и Сюэ в исследовательскую группу входят Тяньюй Лю и Хунъюй Чжао из Йельского университета. Исследование финансировалось Национальными институтами здравоохранения.

Источник

Другие новости по теме

Другие новости на сайте