Искусственный интеллект может значительно ускорить процесс оцифровки коллекций по естественной истории.

Новое исследование показывает перспективность ИИ

Новое исследование, проведённое учёными из Университета Северной Каролины в Чапел-Хилл, демонстрирует, что передовые инструменты искусственного интеллекта, в частности большие языковые модели (LLM), могут точно определять места первоначального сбора образцов растений. Этот процесс известен как геореференсирование.

Статья опубликована в журнале Nature Plants.

Традиционно этот процесс был медленным, дорогостоящим и требовал значительных ручных усилий. Команда исследователей обнаружила, что LLM могут выполнять эту работу с точностью, близкой к человеческой, но при этом значительно быстрее и экономичнее.

«Наше исследование посвящено тому, как большие языковые модели могут справиться с одной из самых серьёзных проблем при оцифровке коллекций растений», — сказал Юян Се, первый автор и постдокторский исследователь на кафедре биологии в UNC.

«Мы являемся пионерами в использовании этих инструментов для геореференсирования, и этот прорыв ускорит оцифровку образцов растений и откроет новые возможности для экологических исследований».

Исследование ставит вопрос о возможности автоматизации

Исследование ставит вопрос о том, может ли искусственный интеллект автоматизировать один из самых трудоёмких этапов оцифровки коллекций по естественной истории. Команда из Каролины выяснила, что да, может. LLM не только выполнили геореференсирование с погрешностью менее 10 километров, превзойдя традиционные методы, но и выполнили задачу за гораздо более короткое время и с меньшими затратами.

«Недавние достижения в области больших языковых моделей могут коренным образом преобразовать процесс геореференсирования, сделав его более быстрым и точным», — сказал Сяо Фэн, автор исследования и доцент кафедры биологии в UNC.

«Это даёт исследователям беспрецедентные возможности для продвижения нашего понимания распределения глобального биоразнообразия».

Значимость результатов

По оценкам, в мире насчитывается 2–3 миллиарда образцов гербариев, но оцифрована лишь малая их часть. Без цифровых записей и пространственных данных исследователи сталкиваются с серьёзными ограничениями в отслеживании утраты биоразнообразия, понимании перемещения видов в условиях изменения климата и анализе сдвигов в экосистемах.

Внедряя геореференсирование на базе ИИ, учёные вскоре смогут быстро оцифровать обширные коллекции по естественной истории, которые до сих пор оставались в значительной степени недоступными.

«Эта технология позволяет нам открыть миллионы записей, которые в настоящее время хранятся в шкафах», — сказал Се. «С помощью возможностей LLM мы можем быстро оцифровать данные о растениях, которые будут иметь решающее значение для решения глобальных экологических проблем».

Традиционные подходы к геореференсированию основаны на ручной интерпретации, специализированном программном обеспечении или многократных проверках экспертами. Исследование UNC является одним из первых, в котором LLM применяются для решения этой задачи, и показывает, что они могут превзойти существующие методы по точности, эффективности и масштабируемости. Этот новый подход открывает двери для оцифровки коллекций по естественной истории с невиданной ранее скоростью.

Предоставлено Университетом Северной Каролины в Чапел-Хилл.

Источник

Другие новости по теме

Другие новости на сайте