Новый вычислительный инструмент помогает учёным интерпретировать сложные данные об отдельных клетках

Учёные из Центра биологических наук Турку при Университете Турку (Финляндия) разработали новый вычислительный метод для интерпретации сложных данных об отдельных клетках. Этот метод помогает исследователям выявлять и группировать типы клеток в разных образцах.

Человеческое тело содержит около 37 триллионов клеток. Некоторые из них более похожи друг на друга, чем другие, но никогда не бывают абсолютно одинаковыми. Современные технологии изучения отдельных клеток позволяют охарактеризовать эту клеточную гетерогенность, измеряя десятки и тысячи молекул, таких как гены или белки, в тысячах отдельных клеток одновременно и предоставляя информацию о здоровье и болезнях.

Небольшое количество крови содержит миллиарды эритроцитов и миллионы иммунных клеток. У каждого типа клеток есть свой молекулярный «отпечаток», который исследователи могут идентифицировать, сочетая технологии изучения отдельных клеток с вычислительными методами.

При изучении нескольких разных образцов учёные должны сначала сопоставить одинаковые типы клеток в этих образцах. Это сложный этап, известный как интеграция данных. Однако современные методы интеграции часто сталкиваются с трудностями, когда типы клеток различаются между образцами или присутствуют в очень разных количествах. В таких случаях несбалансированных данных методы могут ошибочно объединять различные типы клеток.

Чтобы решить эту проблему, исследователи из Университета Турку разработали новый алгоритм на основе машинного обучения, который эффективно интегрирует даже несбалансированные данные из разных образцов. Метод, получивший название Coralysis, был разработан в Центре биологических наук Турку в исследовательской группе профессора Лауры Эло по вычислительной биомедицине, которая также связана с исследовательской программой InFLAMES.

«Технологии изучения отдельных клеток позволяют нам изучать невероятное разнообразие клеток, но сравнивать их между образцами сложно. Это побудило нас разработать метод для надёжного выявления этих скрытых закономерностей», — говорит доцент Сини Юнттила, один из руководителей исследования, опубликованного в журнале Nucleic Acids Research.

«Мы были вдохновлены процессом сборки пазла, когда сначала группируешь кусочки на основе таких характеристик, как цвет и оттенок, а затем смотришь на форму и узоры. Аналогично наш алгоритм последовательно интегрирует клеточные идентичности посредством нескольких раундов разделительной кластеризации», — объясняет докторский исследователь Антонио Соуза, ведущий разработчик Coralysis.

Coralysis реализован как программное обеспечение с открытым исходным кодом. В его основе лежит машинное обучение, что позволяет создавать модели, которые можно использовать для прогнозирования идентичности клеток в новых наборах данных и даже оценивать достоверность этих прогнозов. Это помогает исследователям избежать трудоёмкой и часто ненадёжной задачи ручного определения типов клеток.

Ещё одна уникальная особенность Coralysis — его способность обнаруживать изменения клеточных состояний, которые в противном случае могли бы быть упущены.

«Coralysis предоставляет научному сообществу новый способ изучения клеточного разнообразия и более глубокого понимания сложных данных об отдельных клетках. Делая его общедоступным, мы надеемся поддержать сотрудничество и ускорить открытия в мировом научном сообществе», — говорит профессор Лаура Эло, руководитель проекта.

Предоставлено Университетом Турку.

Источник

Другие новости по теме

Другие новости на сайте