Команда исследователей из Стэнфордской медицины представила SleepFM Clinical — мультимодальную модель, которая обучается на данных клинической полисомнографии и прогнозирует риск развития заболеваний в долгосрочной перспективе по одной ночи сна. Результаты исследования опубликованы в журнале Nature Medicine, а код модели опубликован в открытом доступе в репозитории sleepfm-clinical на GitHub под лицензией MIT.
От полисомнографии за одну ночь до общего представления
Полисомнография регистрирует активность мозга, движения глаз, сердечные сигналы, мышечный тонус, дыхательные усилия и насыщение кислородом в течение всей ночи в лаборатории сна. Это золотой стандарт тестирования в медицине сна, но большинство клинических рабочих процессов используют его только для определения стадий сна и диагностики апноэ во сне.
Исследовательская группа обрабатывает эти многоканальные сигналы как плотные физиологические временные ряды и обучает базовую модель для изучения общего представления по всем модальности.
SleepFM обучен на примерно 585 000 часах записей сна около 65 000 человек, взятых из нескольких когорт. Самая большая когорта поступила из Стэнфордского центра медицины сна, где около 35 000 взрослых и детей прошли исследования в ночное время в период с 1999 по 2024 год. Эта клиническая когорта связана с электронными медицинскими записями, что впоследствии позволяет провести анализ выживаемости для сотен категорий заболеваний.
Архитектура модели и цель предварительного обучения
На уровне моделирования SleepFM использует свёрточную основу для извлечения локальных признаков из каждого канала, за которой следует агрегация на основе внимания по каналам и темпоральный трансформер, работающий с короткими сегментами ночи.
Цель предварительного обучения — контрастное обучение «оставь одного». Для каждого короткого временного сегмента модель создаёт отдельные вложения для каждой группы модальностей, таких как мозговые сигналы, сердечные сигналы и респираторные сигналы, а затем учится выравнивать эти вложения модальностей так, чтобы любое подмножество предсказывало совместное представление оставшихся модальностей.
Этот подход делает модель устойчивой к отсутствующим каналам и гетерогенным монтажным записям, которые часто встречаются в реальных лабораториях сна.
Бенчмарки по определению стадий сна и апноэ
Прежде чем перейти к прогнозированию заболеваний, исследовательская группа проверила, что SleepFM конкурирует со специализированными моделями в стандартных задачах анализа сна. Предыдущая работа уже показала, что простой классификатор на основе вложений SleepFM превосходит сквозные свёрточные сети для классификации стадий сна и обнаружения дыхания, нарушенного во сне, с приростом в макро-AUROC и AUPRC на нескольких общедоступных наборах данных.
В клинических исследованиях тот же предварительно обученный бэкенд повторно используется для определения стадий сна и классификации тяжести апноэ в многоцентровых когортах. Результаты, представленные в исследовательской статье, показывают, что SleepFM соответствует или превосходит существующие инструменты, такие как традиционные свёрточные модели и другие автоматизированные системы определения стадий сна, что подтверждает, что представление отражает основную физиологию сна, а не только статистические артефакты из одного набора данных.
Прогнозирование 130 заболеваний и смертности по одной ночи сна
Основным вкладом этой статьи исследователей из Стэнфорда является прогнозирование заболеваний. Исследовательская группа сопоставляет коды диагнозов в электронных медицинских записях Стэнфорда с кодами заболеваний и определяет более 1000 групп заболеваний-кандидатов. Для каждой группы заболеваний они вычисляют время до первого диагноза после исследования сна и подгоняют модель Кокса на основе вложений SleepFM.
SleepFM выявляет 130 исходов заболеваний, риск которых можно спрогнозировать по одной ночи полисомнографии с высокой степенью дифференциации. К ним относятся смертность от всех причин, деменция, инфаркт миокарда, сердечная недостаточность, хроническая болезнь почек, инсульт, фибрилляция предсердий, несколько видов рака и множество психических и метаболических расстройств.
Для многих из этих состояний показатели производительности, такие как индекс соответствия и площадь под рабочей характеристической кривой, находятся в диапазонах, сопоставимых с установленными показателями риска, даже несмотря на то, что модель использует только записи сна плюс основные демографические данные.
Отчёт также отмечает, что для некоторых видов рака, осложнений беременности, заболеваний системы кровообращения и психических расстройств прогнозы, основанные на SleepFM, достигают уровня точности около 80% для многолетних окон риска. Это говорит о том, что тонкие закономерности в координации между мозгом, сердцем и дыхательными сигналами несут информацию о скрытых процессах заболевания, которые ещё не видны клинически.
Сравнение с более простыми базовыми моделями
Чтобы оценить добавленную стоимость, исследовательская группа сравнила модели риска на основе SleepFM с двумя базовыми моделями. Первая использует только демографические данные, такие как возраст, пол и индекс массы тела. Вторая обучает сквозную модель непосредственно на полисомнографии и результатах, без неконтролируемого предварительного обучения.
По большинству категорий заболеваний предварительно обученное представление SleepFM в сочетании с простым выживающим заголовком даёт более высокую согласованность и более высокую долгосрочную AUROC, чем обе базовые модели.
Это исследование ясно показывает, что выигрыш происходит не столько за счёт сложной прогнозирующей головки, сколько за счёт базовой модели, которая изучила общее представление о физиологии сна. На практике это означает, что клинические центры могут повторно использовать один предварительно обученный бэкенд, изучить небольшие специфические для сайта головки с относительно небольшими помеченными когортами и всё равно приблизиться к современному уровню производительности.
1. Какие данные использовались для обучения модели SleepFM Clinical и какова её основная функция?
Для обучения модели SleepFM Clinical использовались данные клинической полисомнографии, включая регистрацию активности мозга, движений глаз, сердечных сигналов, мышечного тонуса, дыхательных усилий и насыщения кислородом в течение ночи. Основная функция модели — прогнозирование риска развития заболеваний в долгосрочной перспективе на основе анализа одной ночи сна.
2. Какие преимущества предоставляет модель SleepFM Clinical по сравнению с более простыми базовыми моделями?
Модель SleepFM Clinical демонстрирует более высокую согласованность и долгосрочную AUROC по сравнению с базовыми моделями, которые используют только демографические данные или обучаются непосредственно на полисомнографии без предварительного обучения. Это указывает на то, что модель, изучающая общее представление о физиологии сна, приносит значительную пользу в прогнозировании риска заболеваний.
3. Какие заболевания может прогнозировать модель SleepFM Clinical на основе данных полисомнографии?
Модель SleepFM Clinical может прогнозировать риск развития более чем 130 заболеваний, включая смертность от всех причин, деменцию, инфаркт миокарда, сердечную недостаточность, хроническую болезнь почек, инсульт, фибрилляцию предсердий, несколько видов рака и множество психических и метаболических расстройств.
4. Какие методы использовались для предварительной подготовки модели SleepFM Clinical?
Для предварительной подготовки модели SleepFM Clinical использовался метод контрастного обучения «оставь одного». Модель создавала вложения для каждой группы модальностей (мозговые сигналы, сердечные сигналы, респираторные сигналы) и училась выравнивать эти вложения так, чтобы любое подмножество предсказывало совместное представление оставшихся модальностей. Это делает модель устойчивой к отсутствующим каналам и гетерогенным монтажным записям.
5. Какие результаты были получены при сравнении модели SleepFM Clinical с существующими инструментами для определения стадий сна и классификации тяжести апноэ?
При сравнении с существующими инструментами для определения стадий сна и классификации тяжести апноэ модель SleepFM Clinical показала результаты, сопоставимые или превосходящие традиционные свёрточные модели и другие автоматизированные системы определения стадий сна. Это подтверждает, что представление, созданное моделью, отражает основную физиологию сна, а не только статистические артефакты из одного набора данных.