ИИ помогает исследователям увидеть общую картину в клеточной биологии

Изучение экспрессии генов в клетках ракового больного может помочь клиническим биологам понять происхождение рака и предсказать успех различных методов лечения. Однако клетки сложны и многослойны, поэтому то, как биолог проводит измерения, влияет на получаемые данные. Например, измерение белков в клетке может дать другую информацию о влиянии рака, чем измерение экспрессии генов или морфологии клеток.

Значение места получения информации

Важно, откуда в клетке поступает информация. Но чтобы получить полную информацию о состоянии клетки, учёные часто должны проводить множество измерений, используя разные методы, и анализировать их по одному. Методы машинного обучения могут ускорить этот процесс, но существующие методы объединяют всю информацию из каждого модальности измерения вместе, затрудняя определение того, какие данные получены из какой части клетки.

Для решения этой проблемы исследователи из Института Броуда Массачусетского технологического института и Гарварда и Института Пауля Шеррера (PSI) разработали систему на основе искусственного интеллекта, которая изучает, какая информация о состоянии клетки является общей для разных модальностей измерения, а какая информация уникальна для конкретного типа измерения.

Более целостное представление о состоянии клетки

Подход, позволяющий точно определить, какая информация получена из каких частей клетки, обеспечивает более целостное представление о состоянии клетки, облегчая биологу задачу увидеть полную картину клеточных взаимодействий. Это может помочь учёным понять механизмы заболеваний и отслеживать прогрессирование рака, нейродегенеративных расстройств, таких как болезнь Альцгеймера, и метаболических заболеваний, таких как диабет.

«Когда мы изучаем клетки, одного измерения часто недостаточно, поэтому учёные разрабатывают новые технологии для измерения различных аспектов клеток. Хотя у нас есть много способов взглянуть на клетку, в конечном счёте у нас есть только одно основное состояние клетки. Объединяя информацию из всех этих модальностей измерения более разумным образом, мы могли бы получить более полную картину состояния клетки», — говорит ведущий автор Синьи Чжан, бывший аспирант Массачусетского технологического института в области электротехники и компьютерных наук (EECS) и сотрудник Центра Эрика и Венди Шмидт в Институте Броуда Массачусетского технологического института и Гарварда, а ныне руководитель группы в AITHYRA в Вене, Австрия.

Манипулирование множественными измерениями

Существует множество инструментов, которые учёные могут использовать для сбора информации о состоянии клетки. Например, они могут измерить РНК, чтобы увидеть, растёт ли клетка, или измерить морфологию хроматина, чтобы увидеть, справляется ли клетка с внешними физическими или химическими сигналами.

«Когда учёные проводят мультимодальный анализ, они собирают информацию, используя несколько модальностей измерения, и интегрируют её, чтобы лучше понять основное состояние клетки. Некоторая информация фиксируется только одной модальностью, в то время как другая информация является общей для нескольких модальностей. Чтобы полностью понять, что происходит внутри клетки, важно знать, откуда поступила информация», — говорит Шивашанкар.

Часто единственный способ разобраться в этом для учёных — провести несколько отдельных экспериментов и сравнить результаты. Этот медленный и громоздкий процесс ограничивает объём информации, которую они могут собрать.

В новой работе исследователи создали систему машинного обучения, которая специально понимает, какая информация пересекается между различными модальностями, а какая информация уникальна для конкретной модальности, но не фиксируется другими.

«Как пользователь, вы можете просто ввести данные своей клетки, и система автоматически сообщит вам, какие данные являются общими, а какие — специфичными для модальности», — говорит Чжан.

Отличительные особенности данных

В тестах на синтетических наборах данных система правильно фиксировала известную общую и специфичную для модальности информацию. Когда они применили свой метод к реальным наборам данных отдельных клеток, он всесторонне и автоматически провёл различие между активностью генов, зафиксированной совместно двумя модальностями измерения, такими как транскриптомика и доступность хроматина, а также правильно определил, какая информация поступила только из одной из этих модальностей.

Кроме того, исследователи использовали свой метод для определения модальности измерения, которая зафиксировала определённый маркер белка, указывающий на повреждение ДНК у раковых больных. Знание того, откуда поступила эта информация, поможет клиническому учёному определить, какой метод измерения следует использовать для измерения этого маркера.

«В клетке слишком много модальностей, и мы не можем измерить их все, поэтому нам нужен инструмент прогнозирования. Но тогда возникает вопрос: какие модальности мы должны измерять, а какие — прогнозировать? Наш метод может ответить на этот вопрос», — говорит Ульер.

В будущем исследователи хотят, чтобы модель предоставляла более интерпретируемую информацию о состоянии клетки. Они также хотят провести дополнительные эксперименты, чтобы убедиться, что модель правильно распутывает клеточную информацию, и применить модель к более широкому кругу клинических вопросов.

«Недостаточно просто интегрировать информацию из всех этих модальностей, — говорит Ульер. — Мы можем многое узнать о состоянии клетки, если тщательно сравним различные модальности, чтобы понять, как различные компоненты клеток регулируют друг друга».

Это исследование частично финансировалось Центром Эрика и Венди Шмидт в Институте Броуда, Швейцарским национальным научным фондом, Национальными институтами здравоохранения США, Управлением военно-морских исследований США, AstraZeneca, лабораторией MIT-IBM Watson AI, J-клиникой MIT для машинного обучения и здравоохранения и премией исследователя Саймонса.

1. Какие проблемы в клеточной биологии решает использование искусственного интеллекта?

Использование искусственного интеллекта в клеточной биологии позволяет решить проблему анализа данных, полученных из разных модальностей измерения. Система на основе ИИ изучает, какая информация о состоянии клетки является общей для разных методов измерения, а какая — уникальной для конкретного типа измерения. Это обеспечивает более целостное представление о состоянии клетки и облегчает биологу задачу увидеть полную картину клеточных взаимодействий.

2. Какие методы измерения используются для сбора информации о состоянии клетки?

Для сбора информации о состоянии клетки учёные могут использовать различные методы измерения, такие как измерение РНК для определения роста клетки, измерение морфологии хроматина для оценки реакции клетки на внешние сигналы и другие методы.

3. Как система машинного обучения, разработанная исследователями, помогает учёным в анализе данных?

Система машинного обучения, разработанная исследователями, позволяет автоматически различать общую и специфичную для модальности информацию. Она может определить, какая информация пересекается между различными методами измерения, а какая — уникальна для конкретной модальности. Это помогает учёным более эффективно анализировать данные и понимать состояние клетки.

4. Какие перспективы открывает использование системы машинного обучения в клеточной биологии?

Использование системы машинного обучения в клеточной биологии открывает перспективы более глубокого понимания механизмов заболеваний, отслеживания прогрессирования рака, нейродегенеративных расстройств и метаболических заболеваний. Это также может помочь определить, какие методы измерения следует использовать для получения наиболее полной информации о состоянии клетки.

5. Какие цели ставят перед собой исследователи в будущем?

В будущем исследователи хотят, чтобы модель предоставляла более интерпретируемую информацию о состоянии клетки. Они также планируют провести дополнительные эксперименты, чтобы убедиться, что модель правильно распутывает клеточную информацию, и применить модель к более широкому кругу клинических вопросов.

Источник