DeePFAS: искусственный интеллект для обнаружения «вечных химикатов»

DeePFAS — это новая модель глубокого обучения, которая упрощает крупномасштабный нецелевой скрининг «вечных химикатов» (PFAS), проецируя необработанные спектры MS2 в скрытое пространство химических характеристик. Это быстрое решение на основе искусственного интеллекта, призванное заменить сложный традиционный анализ.

Точное обнаружение пер- и полифторалкильных веществ (PFAS), часто называемых «вечными химикатами», представляет собой критически важную и сложную задачу для науки об окружающей среде из-за их структурного разнообразия, отсутствия стандартизированных методов и необходимости в высокочувствительном оборудовании для измерения следовых уровней в окружающей среде.

В исследовании, опубликованном в журнале Environmental Science and Technology, представлен инновационный подход на основе глубокого обучения для преодоления этих препятствий. Распространённость фоновой контаминации и огромное количество различных соединений PFAS ещё больше усложняют разработку универсальных протоколов обнаружения.

Текущая аналитическая методология основана в основном на жидкостной хроматографии и масс-спектрометрии высокого разрешения (LC-HRMS), которая широко используется для анализа PFAS в различных средах (вода, почва, биологические образцы и т. д.). Однако LC-HRMS сопряжена со значительными трудностями, включая высокий риск контаминации, трудоёмкую подготовку проб и времязатратную обработку данных.

Для решения этих проблем группа исследователей из Национального тайваньского университета представила DeePFAS — новый метод глубокого обучения для быстрой и эффективной аннотации соединений PFAS.

DeePFAS использует специализированный спектральный кодировщик, который объединяет свёрточные архитектуры и архитектуры на основе трансформеров, для преобразования необработанных спектров MS2 (химических отпечатков пальцев) в «скрытое пространство». Это скрытое пространство представляет собой краткое отображение химических структурных характеристик, извлечённых из большого массива данных о неназванных соединениях.

Сравнивая эти скрытые представления с молекулами-кандидатами, DeePFAS позволяет высокоэффективно аннотировать спектры MS2. Такой подход значительно упрощает крупномасштабный нецелевой скрининг PFAS и снижает общую аналитическую сложность мониторинга окружающей среды.

Исследование успешно продемонстрировало чувствительность DeePFAS в выявлении специфических для PFAS характеристик, а его практическая осуществимость была подтверждена путём применения к реальным образцам сточных вод.

Команда признала незначительные ограничения, включая случайные ложноположительные аннотации, связанные с определёнными соединениями, где инструмент демонстрировал более низкую достоверность. Будущая работа будет включать расширение библиотеки химических отпечатков пальцев с помощью методов in silico и сравнение результатов DeePFAS с результатами существующих инструментов для повышения достоверности.

В конечном счёте DeePFAS предлагает надёжное решение на основе искусственного интеллекта с открытым исходным кодом для исследователей, и его можно использовать для дальнейших исследований и разработок на GitHub.

«Этот подход предназначен для улучшения нецелевого анализа PFAS и значительного снижения аналитической сложности», — говорит профессор Юфэн Джейн Ценг, автор-корреспондент исследования.

Предоставлено Национальным тайваньским университетом.

Источник