Обеспечение корректного распределения: исследователи разрабатывают метод антикластеризации для анализа секвенирования

Избегание формирования нежелательных кластеров похожих элементов при разделении данных на группы имеет большое значение для анализа медицинских данных. Психологи и специалисты по информатике из Университета Генриха Гейне в Дюссельдорфе (HHU) разработали новый метод решения этой задачи — проблемы «антикластеризации» — в 2020 году. Вместе с исследователями из Калифорнийского университета в Сан-Франциско (UCSF) они создали расширение, важное для анализа данных высокопроизводительного секвенирования и других задач.

Исследователи [описывают](https://www.cell.com/cell-reports-methods/fulltext/S2667-2375(25)00173-0) свой новый инструмент в контексте применения к хроническому заболеванию эндометриозу в журнале Cell Reports Methods.

Эндометриоз: сложное заболевание

Эндометриоз — это комплексное и часто болезненное состояние, которое затрагивает миллионы женщин по всему миру. Ткань, подобная слизистой оболочке матки, растёт за пределами матки, например, на яичниках или даже на кишечнике. Эта ткань может изменяться в течение менструального цикла.

Для изучения клеточных и молекулярных факторов, которые играют роль в развитии и тяжести эндометриоза, многопрофильные эксперты из UCSF и Стэнфордского университета проводят анализ данных сотен женщин в рамках центра ENACT под руководством профессоров докторов Линды С. Гидице и Марины Сироты (UCSF) и Бриса Годильера и Дэвида К. Стивенсона (Стэнфорд).

Антикластеризация и анализ секвенирования

Команда под руководством доцента UCSF доктора Томико Т. Оскотски возглавляет усилия по обеспечению надёжного экспериментального дизайна для исследований, включающих высокопроизводительные технологии, в том числе секвенирование РНК одиночных ядер.

Образцы приходится обрабатывать партиями по техническим причинам. Если эти партии не сбалансированы должным образом — например, по стадии заболевания или возрасту пациентов — так называемые пакетные эффекты могут исказить результаты и в конечном итоге затруднить оценку того, имеют ли наблюдаемые различия биологическую причину или являются просто артефактами технического процесса.

Именно здесь на помощь приходит метод антикластеризации, который доктор Мартин Папенберг из Департамента экспериментальной психологии и профессор доктор Гуннар Клау, заведующий кафедрой алгоритмической биоинформатики — оба из HHU — представили в журнале Psychological Methods в 2020 году.

Исследователи сделали модуль «anticlust» доступным бесплатно.

«Решение технических задач, стоящих перед командой ENACT, требует, помимо предыдущего охвата anticlust, чтобы связанные образцы — например, несколько образцов ткани от одного пациента — были сгруппированы в одной партии, чтобы можно было провести осмысленное сравнение для отдельных пациентов», — говорит доктор Папенберг, объясняя новую задачу, которую он смог решить, разработав так называемый «метод Must-Link».

Профессор Клау говорит: «Мы смогли успешно расширить наш подход, чтобы образцы, которые должны оставаться вместе, были отсортированы в одну партию, сохраняя при этом хороший баланс образцов в разных партиях. Это предотвращает методологическую предвзятость, и медицинские коллеги могут делать выводы из данных, которые относятся конкретно к влиянию генов на эндометриоз».

Профессор Оскотски объясняет: «Используя антикластер для минимизации пакетных эффектов за счёт улучшения экспериментального дизайна, мы уверены, что результаты в наших молекулярных данных действительно отражают лежащую в основе биологию. Этот подход способствует получению новых сведений об эндометриозе и демонстрирует, как хорошо продуманные вычислительные методы могут значительно улучшить биомедицинские исследования».

Предоставлено [Университетом Генриха Гейне в Дюссельдорфе](https://phys.org/partners/heinrich-heine-university-duesseldorf/)

Источник

Другие новости по теме

Другие новости на сайте