Google представляет персонального помощника по здоровью (PHA): мультиагентная система для персонализированного взаимодействия и решения индивидуальных задач в области здоровья

Что такое персональный помощник по здоровью (PHA)?

Большие языковые модели (LLMs) показали высокую производительность в различных областях, таких как клиническое мышление, поддержка принятия решений и приложения для здоровья потребителей. Однако большинство существующих платформ разработаны как инструменты специального назначения, например, для проверки симптомов, цифровых тренировок или в качестве помощников по поиску медицинской информации. Эти подходы часто не учитывают сложность реальных потребностей в области здравоохранения, когда людям требуется комплексное осмысление данных с носимых устройств, личных медицинских записей и результатов лабораторных исследований.

Команда исследователей из Google предложила систему персонального помощника по здоровью (PHA). PHA разработана как мультиагентная система, объединяющая взаимодополняющие роли: анализ данных, медицинские рассуждения и консультирование по вопросам здоровья. Вместо того чтобы возвращать изолированные результаты от одной модели, PHA использует центрального координатора для координации специализированных субагентов, итеративной синтеза их результатов и предоставления последовательных, персонализированных рекомендаций.

Как работает система PHA?

Персональный помощник по здоровью (PHA) основан на семействе моделей Gemini 2.0. Он имеет модульную архитектуру, состоящую из трёх субагентов и одного координатора:

* Агент по науке о данных (DS) интерпретирует и анализирует данные временных рядов с носимых устройств (например, количество шагов, вариабельность сердечного ритма, показатели сна) и структурированные медицинские записи. Он способен разбивать открытые вопросы пользователей на формальные планы анализа, выполнять статистические рассуждения и сравнивать результаты с эталонными данными на уровне популяции. Например, он может определить, связана ли физическая активность за последний месяц с улучшением качества сна.
* Агент эксперта в предметной области (DE) предоставляет медицинскую контекстуализированную информацию. Он интегрирует личные медицинские записи, демографическую информацию и сигналы с носимых устройств для генерации объяснений, основанных на медицинских знаниях. В отличие от общих LLM, которые могут выдавать правдоподобные, но ненадёжные результаты, агент DE следует итеративному циклу «рассуждение — исследование — обследование», сочетая авторитетные медицинские ресурсы с личными данными. Это позволяет ему предоставлять научно обоснованные интерпретации, например, находится ли конкретное измерение артериального давления в безопасном диапазоне для человека с определённым заболеванием.
* Агент-тренер по здоровью (HC) занимается изменением поведения и постановкой долгосрочных целей. Опираясь на установленные стратегии коучинга, такие как мотивационное интервьюирование, он проводит многоэтапные беседы, определяет цели пользователей, уточняет ограничения и генерирует структурированные персонализированные планы. Например, он может помочь пользователю составить еженедельный график тренировок, адаптируясь к индивидуальным барьерам и включая обратную связь от отслеживания прогресса.
* Координатор координирует работу этих трёх агентов. Когда поступает запрос, он назначает основного агента, ответственного за генерацию основного вывода, и вспомогательных агентов для предоставления контекстуальных данных или знаний в предметной области. После сбора результатов координатор запускает итеративный цикл рефлексии, проверяя выходные данные на согласованность и точность, прежде чем синтезировать их в единый ответ. Это гарантирует, что конечный результат будет не просто агрегацией ответов агентов, а интегрированной рекомендацией.

Как оценивалась система PHA?

Исследовательская группа провела одну из наиболее комплексных оценок системы искусственного интеллекта в области здравоохранения на сегодняшний день. Их оценочная система включала 10 эталонных задач, более 7 000 человеческих аннотаций и 1 100 часов оценки со стороны экспертов в области здравоохранения и конечных пользователей.

Оценка агента по науке о данных (DS)

Агент DS оценивался по его способности генерировать структурированные планы анализа и создавать правильный исполняемый код. По сравнению с базовыми моделями Gemini он продемонстрировал:
* значительное увеличение качества планов анализа, улучшив средние оценки экспертов с 53,7 % до 75,6 %;
* сокращение критических ошибок при обработке данных с 25,4 % до 11,0 %;
* улучшение показателей прохождения кода с 58,4 % до 75,5 % с первой попытки, с дальнейшим ростом при итеративной самокоррекции.

Оценка агента эксперта в предметной области (DE)

Агент DE был протестирован по четырём параметрам: фактические знания, диагностическое рассуждение, контекстуальная персонализация и мультимодальный синтез данных. Результаты включают:
* фактические знания: по более чем 2 000 экзаменационным вопросам в стиле доски в области эндокринологии, кардиологии, медицины сна и фитнеса агент DE достиг точности 83,6 %, превзойдя базовую модель Gemini (81,8 %);
* диагностическое рассуждение: по 2 000 случаев самоотчётов о симптомах он достиг 46,1 % точности диагностики по сравнению с 41,4 % для базовой модели Gemini;
* персонализация: в ходе пользовательских исследований 72 % участников предпочли ответы агента DE базовым выводам, сославшись на более высокую надёжность и контекстуальную релевантность;
* мультимодальный синтез: в экспертных обзорах клиницистов резюме здоровья, сгенерированные с использованием данных с носимых устройств, лабораторных данных и данных опросов, выводы агента DE были оценены как более клинически значимые, полные и заслуживающие доверия, чем базовые выводы.

Оценка агента-тренера по здоровью (HC)

Агент HC был разработан и оценён с помощью экспертных интервью и пользовательских исследований. Эксперты подчеркнули необходимость шести навыков коучинга: идентификация целей, активное слушание, уточнение контекста, расширение прав и возможностей, рекомендации SMART (конкретные, измеримые, достижимые, релевантные, ограниченные во времени) и итеративное включение обратной связи.

В ходе оценки агент HC продемонстрировал улучшенный поток беседы и вовлечённость пользователей по сравнению с базовыми моделями. Он избегал преждевременных рекомендаций и вместо этого уравновешивал сбор информации с действенными советами, производя результаты, более соответствующие практикам экспертного коучинга.

Оценка интегрированной системы PHA

На системном уровне координатор и три агента были протестированы вместе в открытых мультимодальных беседах, отражающих реалистичные сценарии в области здравоохранения. И эксперты, и конечные пользователи оценили интегрированного персонального помощника по здоровью (PHA) значительно выше, чем базовые системы Gemini, по показателям точности, согласованности, персонализации и надёжности.

Как PHA способствует развитию искусственного интеллекта в области здравоохранения?

Внедрение мультиагентной системы PHA устраняет несколько ограничений существующих систем искусственного интеллекта в области здравоохранения:
* интеграция разнородных данных: сигналы с носимых устройств, медицинские записи и результаты лабораторных исследований анализируются совместно, а не изолированно;
* разделение труда: каждый субагент специализируется в области, где монолитные модели часто работают неэффективно, например, числовое рассуждение для DS, клиническая обоснованность для DE и поведенческая вовлечённость для HC;
* итеративное отражение: цикл проверки координатора снижает несоответствия, которые часто возникают, когда несколько выходных данных просто объединяются;
* систематическая оценка: в отличие от большинства предыдущих работ, которые полагались на небольшие тематические исследования, персональный помощник по здоровью (PHA) был проверен с использованием большого мультимодального набора данных (исследование WEAR-ME) и при активном участии экспертов.

Каково более широкое значение концепции PHA от Google?

Введение персонального помощника по здоровью (PHA) демонстрирует, что искусственный интеллект в области здравоохранения может выйти за рамки одноцелевых приложений и перейти к модульным, скоординированным системам, способным рассуждать на основе мультимодальных данных. Это показывает, что разбиение задач на специализированных субагентов приводит к измеримому улучшению надёжности, точности и доверия пользователей.

Важно отметить, что эта работа является исследовательской конструкцией, а не коммерческим продуктом. Исследовательская группа подчеркнула, что дизайн PHA является исследовательским и что его внедрение потребует учёта нормативных, конфиденциальности и этических соображений. Тем не менее, структура и результаты оценки представляют собой значительный прогресс в технических основах персонального искусственного интеллекта в области здравоохранения.

Заключение

Система персонального помощника по здоровью (PHA) обеспечивает комплексный дизайн для интеграции данных с носимых устройств, медицинских записей и поведенческого коучинга через мультиагентную систему, координируемую координатором. Его оценка по 10 бенчмаркам с использованием тысяч аннотаций и экспертных оценок показывает последовательное улучшение по сравнению с базовыми LLM в статистическом анализе, медицинских рассуждениях, персонализации и взаимодействии с коучингом.

Структурируя искусственный интеллект в области здравоохранения как скоординированную систему специализированных агентов, а не как монолитную модель, PHA демонстрирует, как можно повысить точность, согласованность и доверие в приложениях для здоровья. Эта работа закладывает основу для дальнейших исследований агентских систем здравоохранения и выделяет путь к созданию интегрированных, надёжных инструментов для рассуждений в области здравоохранения.

1. Какие задачи решает персональный помощник по здоровью (PHA) и как он отличается от существующих платформ в области здравоохранения?

Персональный помощник по здоровью (PHA) решает задачи анализа данных, медицинских рассуждений и консультирования по вопросам здоровья. Он отличается от существующих платформ тем, что объединяет взаимодополняющие роли в одной системе и использует центрального координатора для координации специализированных субагентов. Это позволяет PHA предоставлять последовательные, персонализированные рекомендации, учитывая сложность реальных потребностей в области здравоохранения.

2. Какие агенты входят в состав системы PHA и какие функции они выполняют?

В состав системы PHA входят четыре агента:
* Агент по науке о данных (DS) интерпретирует и анализирует данные временных рядов с носимых устройств и структурированные медицинские записи.
* Агент эксперта в предметной области (DE) предоставляет медицинскую контекстуализированную информацию, интегрируя личные медицинские записи, демографическую информацию и сигналы с носимых устройств.
* Агент-тренер по здоровью (HC) занимается изменением поведения и постановкой долгосрочных целей, опираясь на стратегии коучинга.
* Координатор координирует работу этих трёх агентов, назначая основного агента и вспомогательных агентов для предоставления контекстуальных данных или знаний в предметной области.

3. Как оценивалась система PHA и какие результаты были получены?

Исследовательская группа провела комплексную оценку системы искусственного интеллекта в области здравоохранения. Они использовали 10 эталонных задач, более 7 000 человеческих аннотаций и 1 100 часов оценки со стороны экспертов в области здравоохранения и конечных пользователей. Результаты показали значительное улучшение качества планов анализа, сокращение критических ошибок при обработке данных и улучшение показателей прохождения кода. Агент DE достиг высокой точности в фактических знаниях, диагностическом рассуждении, персонализации и мультимодальном синтезе данных. Агент HC продемонстрировал улучшенный поток беседы и вовлечённость пользователей. Интегрированный персональный помощник по здоровью (PHA) был оценён значительно выше, чем базовые системы Gemini, по показателям точности, согласованности, персонализации и надёжности.

4. Какие ограничения существующих систем искусственного интеллекта в области здравоохранения устраняет внедрение мультиагентной системы PHA?

Внедрение мультиагентной системы PHA устраняет несколько ограничений существующих систем искусственного интеллекта в области здравоохранения:
* Интеграция разнородных данных: сигналы с носимых устройств, медицинские записи и результаты лабораторных исследований анализируются совместно, а не изолированно.
* Разделение труда: каждый субагент специализируется в области, где монолитные модели часто работают неэффективно.
* Итеративное отражение: цикл проверки координатора снижает несоответствия, которые часто возникают, когда несколько выходных данных просто объединяются.
* Систематическая оценка: в отличие от большинства предыдущих работ, которые полагались на небольшие тематические исследования, персональный помощник по здоровью (PHA) был проверен с использованием большого мультимодального набора данных и при активном участии экспертов.

5. Какое более широкое значение имеет концепция PHA от Google для развития искусственного интеллекта в области здравоохранения?

Концепция PHA от Google демонстрирует, что искусственный интеллект в области здравоохранения может выйти за рамки одноцелевых приложений и перейти к модульным, скоординированным системам, способным рассуждать на основе мультимодальных данных. Это показывает, что разбиение задач на специализированных субагентов приводит к измеримому улучшению надёжности, точности и доверия пользователей. Работа закладывает основу для дальнейших исследований агентских систем здравоохранения и выделяет путь к созданию интегрированных, надёжных инструментов для рассуждений в области здравоохранения.

Источник