Белки поддерживают жизнь в том виде, в каком мы её знаем, выполняя множество важных структурных и функциональных ролей в организме. Однако большое внимание к ним затмило существование подкласса белков поменьше — микропротеинов.
Микропротеины были потеряны в 99% ДНК, которую считали «некодирующей», прячась в обширных, неизведанных участках генетического кода. Но, несмотря на свой небольшой размер и неуловимость, их влияние может быть таким же значительным, как и у крупных белков.
Учёные из Института Солка изучают загадочную «тёмную сторону» генома в поисках микропротеинов. С помощью нового инструмента ShortStop исследователи могут изучать генетические базы данных и выявлять участки ДНК в геноме, которые, вероятно, кодируют микропротеины.
Важно отметить, что ShortStop также предсказывает, какие микропротеины наиболее вероятно будут биологически значимыми, экономя время и деньги в поисках микропротеинов, участвующих в здоровье и болезнях.
ShortStop проливает новый свет на существующие наборы данных, выделяя микропротеины, которые ранее было невозможно найти. Команда из Института Солка уже использовала этот инструмент для анализа набора данных о раке лёгких и обнаружила 210 совершенно новых кандидатов в микропротеины — с одним выделенным валидированным микропротеином, которые в будущем могут стать хорошими терапевтическими мишенями.
Основные выводы
- Большинство белков в нашем организме хорошо изучены, но недавние открытия показывают, что мы упустили тысячи небольших скрытых белков — микропротеинов, кодируемых ранее незамеченными участками нашего генома, — говорит старший автор Алан Сагателиан, профессор и обладатель кафедры доктора Фредерика Полсена в Институте Солка.
- Учёные давно изучали только те участки ДНК, которые кодируют большие белки, а остальные считали «мусорной ДНК». Но теперь мы узнаём, что эти другие участки на самом деле очень важны, а микропротеины, которые они производят, могут играть решающую роль в регуляции здоровья и болезней.
Трудности обнаружения микропротеинов
Обнаружить и каталогизировать микропротеины сложно, в основном из-за их размера. По сравнению со стандартными белками, которые могут содержать от сотен до тысяч аминокислот, микропротеины обычно содержат менее 150 аминокислот, что затрудняет их обнаружение с помощью стандартных методов анализа белков.
Поэтому вместо поиска самих микропротеинов учёные ищут в больших общедоступных наборах данных последовательности ДНК, которые их кодируют.
Учёные выяснили, что определённые участки ДНК, называемые небольшими открытыми рамками считывания (smORFs), могут содержать инструкции по созданию микропротеинов. Существующие экспериментальные методы уже каталогизировали тысячи smORFs, но эти инструменты остаются трудоёмкими и дорогостоящими.
Кроме того, их неспособность отделить потенциально функциональные микропротеины от нефункциональных микропротеинов замедлила их обнаружение и характеристику.
Инструмент ShortStop
ShortStop радикально меняет этот рабочий процесс, оптимизируя обнаружение smORF путём сортировки микропротеинов на функциональные и нефункциональные категории. Ключ к двухклассовой сортировке ShortStop заключается в том, как он обучен как система машинного обучения.
Его обучение основано на наборе данных отрицательного контроля из компьютерных сгенерированных случайных smORFs. ShortStop сравнивает найденные smORFs с этими приманками, чтобы быстро решить, будет ли новый smORF функциональным или нефункциональным.
ShortStop не может однозначно сказать, будет ли smORF кодировать биологически значимый микропротеин, но эта двухклассовая система значительно сокращает экспериментальный пул. Теперь исследователи могут тратить меньше времени на ручную сортировку наборов данных и неудачи за лабораторным столом.
Когда исследователи применили ShortStop к ранее опубликованному набору данных smORF, они определили 8% как вероятные функциональные микропротеины, определив их в качестве приоритетных для последующего целенаправленного изучения.
Это ускоряет характеристику микропротеинов путём отсеивания последовательностей, которые вряд ли будут иметь биологическую значимость. ShortStop также может идентифицировать микропротеины, которые были упущены другими методами, включая один, который был подтверждён путём обнаружения в клетках человека и тканях.
«Что делает ShortStop особенно мощным, так это то, что он работает с распространёнными типами данных, такими как наборы данных РНК-секвенирования, которые уже используются во многих лабораториях», — говорит первый автор Брендан Миллер, постдокторский исследователь в лаборатории Сагателиана.
«Это означает, что теперь мы можем искать микропротеины в здоровых и поражённых тканях в масштабе, который позволит нам получить новое представление о биологии человека и откроет новые пути для диагностики и лечения заболеваний, таких как рак и болезнь Альцгеймера».
Исследователи уже использовали ShortStop для идентификации микропротеина, который был активизирован в опухолях лёгких. Они проанализировали генетические данные из опухолей лёгких человека и соседних нормальных тканей, чтобы создать список потенциальных функциональных smORFs.
Среди smORFs, обнаруженных ShortStop, один выделялся — он экспрессировался больше в опухолевой ткани, чем в нормальной, что позволяет предположить, что он может служить биомаркером или функциональным микропротеином для рака лёгких.
Идентификация этого микропротеина, связанного с раком лёгких, демонстрирует ценность ShortStop и машинного обучения для определения приоритетов кандидатов для будущих исследований и разработки терапевтических методов.
«Существует так много данных, которые мы уже можем обработать с помощью ShortStop, чтобы найти новые микропротеины, связанные со здоровьем и болезнями, начиная от болезни Альцгеймера и ожирения и заканчивая другими состояниями», — говорит Сагателиан.
Другие новости по теме
- ЮАР начала вводить в рога носорогов радиоактивные вещества для борьбы с браконьерством
- Новое исследование проливает свет на стратегии выживания паразита, вызывающего лейшманиоз
- Находка, которая может изменить наше понимание жизни за пределами Земли
- Учёные создали безопасный и питательный белковый корм для собак с помощью ферментации дрожжей
- Вместе мы сильнее: исследование показывает, что большие косяки рыб принимают более быстрые и точные решения при угрозе нападения хищников
- Изменения в рационе стимулировали физическую эволюцию ранних людей
- Зубы человека эволюционировали под нашу диету
- Не пропустите это астрономическое событие: Луна и Антарес
- Светлячки озаряют летние вечера
- Научное открытие — новое оружие в борьбе с браконьерством носорогов
Другие новости на сайте
- Доход Reddit стремительно растёт благодаря ставке на ИИ и рекламу
- МВФ рекомендует учитывать биткоин при расчёте национального ВВП
- Криптовалюты в зале суда: количество коллективных исков в 2025 году может достичь исторического максимума
- Затмение звёзд 2 и 3 Скорпиона 3 августа
- Политика США в отношении цифровых активов: ключевые рекомендации рабочей группы
- Apple продала три миллиарда iPhone
- Apple планирует «значительно» нарастить инвестиции в ИИ и открыта к слияниям и поглощениям
- AgentSociety: фреймворк с открытым исходным кодом для моделирования крупномасштабных социальных взаимодействий с помощью агентов на базе больших языковых моделей
- В интернете есть много сайтов с информацией на эту тему. [Посмотрите, что нашлось в поиске](https://ya.ru)
- Аналитики Bernstein подробно изучают компании, управляющие казначейскими активами Ethereum, и выделяют уникальные риски