Современные модели ИИ не всегда лучше простых в прогнозировании реакции на генетические возмущения

Исследователи из Федеральной политехнической школы Лозанны (EPFL) разработали Systema — новый инструмент для оценки эффективности моделей ИИ при прогнозировании последствий генетических возмущений.

Понимание генетических возмущений

Понимание того, как генетические возмущения (когда учёные намеренно изменяют гены, чтобы увидеть, как они влияют на клетки) влияют на клетки, имеет ключевое значение для понимания функций наших генов и механизмов их регуляции. Эти знания находят важное применение в клеточной инженерии и разработке новых методов лечения.

Сегодня учёные могут тестировать множество различных генетических возмущений в лаборатории. Однако существует так много возможных комбинаций, что протестировать их все невозможно.

Модели ИИ и машинное обучение

ИИ и машинное обучение создали возможность использовать информацию из больших биологических наборов данных для прогнозирования того, что произойдёт при изменении гена, даже если такое изменение никогда не тестировалось в лаборатории. Но насколько хорошо эти модели работают на самом деле?

Чтобы это выяснить, исследователи из лаборатории машинного обучения для биомедицины (MLBio) в EPFL, сотрудничая с международными коллегами, протестировали лучшие модели ИИ. Они использовали данные из десяти различных экспериментов и сравнили их с простыми статистическими подходами.

В исследовании, опубликованном в Nature Biotechnology, команда обнаружила нечто удивительное: простые подходы показали такие же, а иногда и лучшие результаты, чем продвинутые модели ИИ на многих наборах данных.

«Наблюдение, что простые подходы работают так же хорошо, как и продвинутые модели ИИ, заставило нас задуматься: действительно ли продвинутые модели понимают, что делают изменения в генах? Подходят ли стандартные метрики для оценки этих моделей?» — сказала доцент Мария Брпич, руководитель лаборатории MLBio.

Инструмент Systema

Исследователи также обнаружили, что распространённые способы проверки производительности моделей могут вводить в заблуждение. Они часто не учитывают систематические различия между обработанными и необработанными клетками. В этих случаях модели могут не изучать истинные эффекты генетических изменений. Вместо этого они могут просто замечать закономерности, вызванные дизайном эксперимента, или эффекты, которые происходят почти для всех генетических изменений.

Для решения этой проблемы исследователи создали инструмент под названием Systema. Он снижает влияние систематических предубеждений и фокусируется на уникальных эффектах каждого генетического возмущения. Systema также упрощает понимание того, что на самом деле делают генетические возмущения, — объяснил Рамон Виньяс Торне, постдокторант в лаборатории MLBio и первый автор статьи.

С помощью Systema исследователи обнаружили, что моделям ИИ всё ещё очень сложно предсказывать последствия новых генетических изменений. Некоторые модели могли делать правильные предположения, когда гены были частью одного биологического процесса, но в целом задача остаётся сложной.

Systema помогает отличить модели, которые просто улавливают предубеждения, от тех, которые действительно понимают, как генетические модификации влияют на клетки.

Исследователи предлагают оценивать модели ИИ на основе их биологической ценности. Это означает, что нужно смотреть, насколько хорошо прогнозы объясняют клеточные характеристики.

«В будущем более масштабные и разнообразные эксперименты помогут улучшить эти прогнозы. Также новые технологии, которые рассматривают клетки более детально, например, их форму или расположение, могут помочь нам лучше понять, как изменения в генах влияют на клетки и ткани», — заключила Брпич.

Предоставлено Федеральной политехнической школой Лозанны (EPFL)

Источник

Другие новости по теме

Другие новости на сайте