Расшифровка новых «букв» ДНК для развития медицины и биотехнологий

Группа исследователей под руководством Института генома Агентства по науке, технологиям и исследованиям (ASTAR GIS) разработала метод точного и эффективного чтения ДНК, содержащей нестандартные основания. Эта задача ранее считалась слишком сложной для обычных секвенаторов ДНК. Их работа, опубликованная в журнале Nature Communications*, сочетает нанопоровое секвенирование с искусственным интеллектом (ИИ) для быстрой и точной расшифровки этих дополнительных «букв».

ДНК — это инструкция природы

ДНК состоит из четырёх стандартных «букв» или оснований: A, T, C и G. Учёные давно мечтали расширить этот генетический алфавит, добавив новые «буквы», известные как неканонические основания (NCB). Эти NCB могут встречаться в природе у некоторых вирусов или быть созданными в лаборатории. Они обладают потенциалом для открытия новых способов проектирования молекул, материалов и биологических систем.

Однако машины для секвенирования ДНК были созданы для распознавания только четырёх стандартных оснований. Из-за этого они с трудом обнаруживают или расшифровывают новые основания, что мешает учёным полностью использовать их потенциал для разработки более точных лекарств, создания искусственных геномов для устойчивого химического производства и проектирования программируемых материалов и наномасштабных устройств для будущих технологий.

Преодоление ограничений

«Наша способность быстро читать текст во многом зависит от того, насколько мы знакомы с используемой лексикой», — сказал доктор Маурисио Лиссабоа Перес, учёный из A*STAR GIS и первый автор исследования. «Аналогично, чтобы модель ИИ могла «скорочитать» ДНК, она должна увидеть достаточно примеров каждого основания. Неканонические основания встречаются редко, и их сложнее производить, поэтому нам пришлось разработать творческие способы создания достаточного количества примеров для обучения нашей модели ИИ».

Команда создала большую библиотеку искусственной ДНК, содержащей как стандартные, так и нестандартные основания в различных комбинациях, а затем использовала нанопоровое секвенирование для записи уникальных электрических сигналов, возникающих при прохождении каждого основания через микроскопические поры.

Поскольку данные часто были шумными и неполными, исследователи разработали подход на основе ИИ, который мог учиться и совершенствоваться итеративно, улучшая свои прогнозы с течением времени. Они также усовершенствовали обучение модели ИИ, творчески переставляя существующие данные сигналов для представления большего количества комбинаций.

Этот адаптивный метод позволил ИИ точно распознавать отличительный паттерн каждого основания, позволяя секвенатору читать новые «буквы» ДНК напрямую.

Результаты исследования

Хотя другие исследовательские группы изучали аналогичные проблемы, это исследование — первое, которое демонстрирует секвенатор ДНК, способный напрямую и надёжно идентифицировать нестандартные основания в масштабе с использованием ИИ, преодолевая ключевые узкие места, такие как ограниченные обучающие данные.

«Возможность точно идентифицировать эти новые основания в масштабе даёт нам гораздо более богатый словарный запас для записи и чтения биологической информации», — сказал доктор Ниранджан Нагараджан, заместитель директора по ИИ и вычислениям в A*STAR GIS и старший автор исследования. «Это похоже на изучение новых букв, которые позволяют нам понимать гораздо больше слов и значений в языке жизни».

Этот прорыв может привести к инновациям во многих областях. Исследователи планируют расширить свою работу, чтобы обнаружить больше нестандартных оснований в вирусах и улучшить способность модели ИИ обнаруживать их.

«Мы воодушевлены этим новым методом секвенирования ДНК и возможностями, которые он открывает», — сказала доктор Вэнь Юэ, исполнительный директор A*STAR GIS. «Работа с расширенным ДНК-алфавитом создаст больше возможностей для учёных в разработке новых терапевтических средств, новых организмов, которые производят химические вещества в окружающей среде, и новых программируемых материалов для наноструктур и нанороботов. Эти инновации могут способствовать научным открытиям, создать экономическую ценность и, в конечном итоге, улучшить жизнь».

Предоставлено:
[Агентство по науке, технологиям и исследованиям (A*STAR), Сингапур](https://phys.org/partners/agency-for-science—technology-and-research—a-star—singapore/)

Источник