Эксперты всё чаще обращаются к машинному обучению для прогнозирования устойчивости патогенов к антибиотикам. С его помощью можно выявлять механизмы резистентности на основе генетики возбудителя. Однако к результатам следует относиться с осторожностью.
Исследователи из Института исследований инфекций на основе РНК имени Гельмгольца (HIRI) в Вюрцбурге показали, что модели часто менее надёжны, чем предполагалось. Их выводы опубликованы в журнале PLOS Biology. Работа способствует разработке более надёжных инструментов для прогнозирования и борьбы с устойчивостью к антибиотикам.
Устойчивость к антибиотикам: растущая угроза
Инфекции, устойчивые к антибиотикам, представляют растущую угрозу во всём мире. Вместо традиционного культивирования бактерий и тестирования их реакции на антибиотики лаборатории всё чаще анализируют генетический материал бактерий, чтобы выявить устойчивость на ранней стадии. По ДНК-последовательностям патогена исследователи могут определить механизмы его резистентности и подобрать эффективные варианты лечения.
Компьютерные программы, «обучающиеся» на существующих данных секвенирования, — перспективный способ предсказать, какие антибиотики будут эффективны, а какие нет. Однако у этих технологий есть недостатки. Один из часто недооцениваемых факторов — предположения, которые делают сами компьютерные методы.
Почему классические методы машинного обучения могут быть неточными
Большинство классических методов машинного обучения — технологий, которые обучаются на данных и самостоятельно распознают закономерности без явного программирования — требуют, чтобы обучающие данные были независимыми и одинаково распределёнными. Однако это не так с образцами бактерий: близкородственные бактерии имеют много общих характеристик.
Во время эпидемии «успешные» варианты быстро преобладают. Если они быстро размножаются, в том числе благодаря механизмам защиты от антибиотиков, то автоматически распространяются и другие характеристики — даже если они не связаны с устойчивостью. Это может создать ложное впечатление, что определённые генетические характеристики напрямую связаны с устойчивостью, когда на самом деле они просто сосуществуют из-за родства патогенов. Поэтому алгоритмы обучаются предсказывать родственные штаммы, а не саму устойчивость.
Анализ более 24 000 геномов
В этом проекте учёные проанализировали более 24 000 геномов пяти основных видов бактерий, вызывающих заболевания:
* Escherichia coli — возбудитель желудочно-кишечных и урологических заболеваний;
* Klebsiella pneumoniae — условно-патогенный микроорганизм;
* Salmonella enterica — возбудитель желудочно-кишечных заболеваний;
* Staphylococcus aureus — условно-патогенный микроорганизм, обитающий на коже;
* Streptococcus pneumoniae — основная причина внебольничной пневмонии.
Для этих микробов классические методы машинного обучения дают чрезмерно оптимистичную картину того, насколько хорошо работает прогнозирование устойчивости.
«Мы хотели исследовать, как предвзятый отбор влияет на работу инструментов машинного обучения для прогнозирования устойчивости», — говорит Ларс Барквист, учёный, связанный с HIRI, и профессор Университета Торонто в Канаде. Барквист инициировал исследование и является соответствующим автором публикации.
Исследователи создали сценарии, в которых устойчивость связана с бактериальными семейными деревьями. Таким образом, они смогли показать, что традиционные подходы могут приводить к чрезмерно оптимистичным результатам, которые невозможно обобщить.
«Когда модели оцениваются более реалистично, путём обеспечения того, чтобы тренировочные и тестовые бактерии не принадлежали к одному генетическому семейству, точность падает — иногда резко», — отмечает первый автор исследования Яньин Ю, которая защитила кандидатскую диссертацию в лаборатории Ларса Барквиста.
Эти результаты показывают, что модели, которые не учитывают эволюционные отношения между бактериями, могут не уловить истинные сигналы устойчивости, ограничивая тем самым их способность делать точные прогнозы в ранее не встречавшихся штаммах. Как следствие, такие методы вряд ли смогут предоставить надёжные рекомендации для точного лечения по мере появления новых патогенных линий.
Исследование даёт комплексный обзор масштабов этой проблемы. «Многие предыдущие оценки методов, вероятно, были слишком оптимистичными», — заключает Барквист. «Чтобы разработать надёжные инструменты для прогнозирования устойчивости к антибиотикам, важно учитывать эволюционные отношения бактерий», — отмечает Ю.
Результаты исследования предоставляют ценные отправные точки для разработки улучшенных методов тестирования и наборов данных и могут служить руководством для будущих моделей и систем мониторинга. Таким образом, они способствуют новым методологическим подходам, учитывающим структуру бактериальных популяций и позволяющим делать более точные прогнозы.
Предоставлено Helmholtz Association of German Research Centres.
Другие новости по теме
- Как наиболее многочисленные бактерии океана делятся на экологически различные группы
- Питательные грибные белки из растительных остатков: вкусное решение для веганов и вегетарианцев
- Технология Project Airbear может помочь предсказывать оптимальные места обитания коал с воздуха
- Спектроскопия листьев предсказывает степень зрелости плодов: метод на основе света позволяет избежать потерь урожая
- Новый метод генного редактирования может изменить подход к борьбе с комарами
- Тест крови OxiDx показывает, что скачки без окислительного стресса повышают работоспособность лошадей
- Падения цен на камбалу в Фукусиме после сброса очищенной воды не обнаружено
- В ваших рождественских украшениях может скрываться немного барсука и жабы.
- Лидеры Калифорнии отмечают «возвращение» лосося, но риски, связанные с климатом, сохраняются
- Новое исследование раскрывает микробное биоразнообразие почвы деhesa.
Другие новости на сайте
- Представляем Академию OpenAI для новостных организаций
- Как организовать полностью автономный мультиагентный процесс исследования и написания с помощью CrewAI и Gemini для интеллектуального взаимодействия в реальном времени
- Исследователи используют виртуальную реальность для обучения в классе
- Распад тёмной материи: неизвестные линии рентгеновского излучения в спектрах скоплений галактик могут указать путь
- ДНК бронзового века из Калабрии: обнаружено уникальное горное сообщество
- Модель GoMars симулирует 50-летний цикл марсианской пыли
- Как наиболее многочисленные бактерии океана делятся на экологически различные группы
- Тонкие изменения в материалах приводят к удивительному электромагнитному поведению
- Питательные грибные белки из растительных остатков: вкусное решение для веганов и вегетарианцев
- Лаборатория на дронах в режиме реального времени отслеживает вынос нитратов из-за удобрений.