Искусственный интеллект улучшает точность анализа наборов генов с помощью экспертных баз данных

Исследователи из Национальных институтов здравоохранения (NIH) разработали агент искусственного интеллекта (ИИ), работающий на основе большой языковой модели (LLM), который создаёт более точные и информативные описания биологических процессов и их функций при анализе наборов генов. Эта работа опубликована в журнале Nature Methods.

Система GeneAgent

Система, получившая название GeneAgent, перепроверяет свои первоначальные прогнозы (также известные как утверждения) на точность, сверяясь с информацией из установленных баз данных, составленных экспертами, и возвращает отчёт о проверке, в котором подробно описаны её успехи и неудачи.

ИИ-агент может помочь исследователям интерпретировать молекулярные данные, полученные с помощью высокопроизводительных технологий, и выявлять соответствующие биологические пути или функциональные модули, что может привести к лучшему пониманию того, как различные заболевания и состояния влияют на группы генов по отдельности и вместе.

Принцип работы GeneAgent

ИИ-агент GeneAgent перепроверяет свои утверждения, сверяясь с данными из внешних баз, составленных экспертами. Исследовательская группа сначала протестировала GeneAgent на 1106 наборах генов, полученных из существующих баз данных с известными функциями и названиями процессов.

Для каждого набора генов GeneAgent сначала генерирует первоначальный список функциональных утверждений. Затем он независимо использует свой модуль самопроверки, чтобы перепроверить эти утверждения по базам данных, составленным экспертами, и создать отчёт о проверке, в котором указано, подтверждается ли каждое из его утверждений, частично подтверждается или опровергается.

Чтобы определить точность GeneAgent на этапе самопроверки, исследователи привлекли двух экспертов для ручной проверки 10 случайно выбранных наборов генов с общим количеством утверждений 132 и оценки правильности отчётов о самопроверке GeneAgent.

Эксперты определили, что 92% решений GeneAgent были правильными, что свидетельствует о высокой эффективности системы в проведении самопроверки, особенно по сравнению с GPT-4. Детальный анализ подтвердил эффективность модели в минимизации «галлюцинаций» ИИ и создании более надёжных аналитических описаний.

Реальное применение GeneAgent

Исследовательская группа также рассмотрела практическое применение GeneAgent на наборах генов животных-моделей. Применив систему к семи новым наборам генов, полученных из клеточных линий меланомы мышей, GeneAgent смог предложить ценную информацию о новых функциях для конкретных генов. Это может означать открытие новых знаний о потенциальных новых мишенях для лекарств от таких заболеваний, как рак.

Хотя LLM, такие как GeneAgent, всё ещё ограничены объёмом информации, которую они могут использовать, и неспособностью рассуждать как люди, способность GeneAgent к самостоятельной проверке фактов демонстрирует многообещающие результаты в минимизации «галлюцинаций» ИИ.

Предоставлено Национальными институтами здравоохранения.

Источник

Другие новости по теме

Другие новости на сайте

Оставьте комментарий