Массовое параллельное профилирование обнаруживает тысячи скрытых вирусных белков и консервативные механизмы

Учёные из Института Броуда при Массачусетском технологическом институте и Гарварде выявили 4 208 ранее не аннотированных открытых рамок считывания (ORF) в 679 геномах вирусов, связанных с человеком, используя высокопроизводительный метод, называемый массовым параллельным профилированием рибосом (MPRP).

Многие вирусы несут генетические инструкции, которые ускользают от обнаружения стандартными инструментами аннотации генома. Помимо хорошо документированных кодирующих белок областей, вирусные геномы часто содержат неканонические ORF — короткие или нерегулярные последовательности, которые могут начинаться не со стандартного кодона ATG.

Эти скрытые последовательности, как известно, влияют на репликацию вируса, иммунные реакции хозяина и регуляцию генов. Однако их обнаружение требует экспериментальных методов, выходящих за рамки современных вычислительных инструментов. Существующие подходы, включая традиционное профилирование рибосом, ограничены необходимостью использования систем культивирования патогенов и объектов с высоким уровнем биобезопасности.

В исследовании, опубликованном в журнале Science, учёные разработали MPRP для идентификации транслируемых регионов путём профилирования синтетических вирусных последовательностей на тысячах олигонуклеотидов.

Анализ охватил 20 170 олигонуклеотидов, полученных из 679 вирусных геномов, экспрессированных в человеческих клеточных линиях HEK293T и A549. Каждый фрагмент из 200 нуклеотидов представлял либо дикую форму, либо модифицированные последовательности, нацеленные на 5′-нетранслируемые области (UTR) и начала аннотированных кодирующих областей.

Вирусная экспрессия осуществлялась как капзависимыми, так и IRES-зависимыми механизмами в условиях, имитирующих стресс вирусной инфекции. Воспроизводимость была высокой как внутри реплик клеточного типа (R Пирсона = 0,92 между двумя запусками HEK293T), так и между клетками HEK293T и A549 (R = 0,89). MPRP обнаружил в общей сложности 5 381 транслируемую ORF, из которых 4 208 были ранее неаннотированными неканоническими ORF.

Профили отпечатков рибосом были сильно сконцентрированы в экспериментально определённых местах начала кодирования, включая множество не-AUG стартов, и демонстрировали ожидаемую тринуклеотидную периодичность.

Для точного определения скрытых стартовых позиций каждый ген был синтезирован в трёх различных 200-нуклеотидных олигонуклеотидах: фрагмент 5′-UTR+первой CDS дикого типа, идентичный фрагмент с аннотированным AUG, мутированным до GCC, и фрагмент с расширенной областью вверх по течению, так что потеря сигнала отпечатка в AUG→GCC мутанте подтверждает истинное местоположение начала.

Скрининг также выявил сотни upstream ORF (uORF) с выраженными пиками остановки рибосом, что согласуется с репрессией трансляции нижележащих основных кодирующих последовательностей.

Сравнение с наборами данных о естественной вирусной инфекции показало сильное совпадение отпечатков рибосом, причём синтетическое профилирование точно воспроизводило модели трансляции таких вирусов, как грипп А и гепатит С. Метод также выявил внутреннюю ORF в +1 фрейме гена M1 вируса гриппа у нескольких штаммов, включая вирус птичьего гриппа H5N1, связанного с недавними вспышками среди домашнего скота.

Дальнейший анализ связал транслируемые неканонические ORF с распознаванием иммунной системой. В повторно проанализированных наборах данных иммунопептидома были обнаружены семь пептидов, полученных из недавно открытых ORF, на комплексах антигенов лейкоцитов человека класса I (HLA-I). Шесть из них, как прогнозировалось, будут эффективно связываться с иммунными рецепторами хозяина. Включение неканонических ORF увеличило общее количество картированных пептидов HCMV на 7,4%, а некоторые из них превосходили канонические белки по выходу пептидов на единицу длины.

Чтобы изучить, как uORF могут модулировать экспрессию вирусных белков, исследователи повторили эксперименты в условиях, повышающих фосфорилирование eIF2alpha, известного регулятора трансляции во время стресса.

В клетках, обработанных арсенитом натрия (для индукции фосфорилирования eIF2α), рибосомы обходили многие uORF и сдвигали трансляцию в сторону основных кодирующих последовательностей. Это поведение соответствует хорошо охарактеризованному стрессорному ответу, при котором фосфорилированный eIF2α снижает вероятность инициации трансляции в ингибирующих uORF, позволяя рибосомам сканировать дальше вниз по течению.

Это важное открытие, поскольку оно намекает на консервативный механизм, с помощью которого вирусная экспрессия генов может временно регулироваться через пути стрессового ответа хозяина.

Кодируя uORF, которые реагируют на фосфорилирование eIF2α, вирусы могут синхронизировать трансляцию ключевых белков с определёнными фазами клеточного состояния хозяина, потенциально откладывая производство белков до тех пор, пока иммунная защита не будет подавлена или пока не станет полностью доступным механизм репликации.

Это говорит о том, что uORF — это не просто случайные особенности вирусных геномов, а могут служить регуляторными модулями, сформированными под действием селективного давления для использования систем контроля трансляции хозяина.

Исследователи приходят к выводу, что MPRP предлагает быстрый масштабируемый метод идентификации не транслируемых регионов в вирусах, включая те, которые трудно культивировать или требуют содержания в условиях высокого уровня биобезопасности. Выявляя непризнанные вирусные белки, метод открывает новые направления для изучения и понимания иммунных ответов, регуляции экспрессии генов и ускорения разработки вакцин.

Источник

Оставьте комментарий