Научный ассистент на основе искусственного интеллекта для каждого этапа научного процесса

Исследователи разработали «научного ассистента» на базе искусственного интеллекта, который призван ускорить научный процесс. Этот инструмент помогает учёным формулировать новые вопросы для исследований, анализировать и интерпретировать данные, а также создавать научные документы.

Инструмент называется Denario. Он использует большие языковые модели, чтобы помочь учёным в решении различных задач: от разработки новых гипотез до составления рукописей. Команда надеется, что Denario ускорит исследования, сделает их более динамичными и междисциплинарными.

Как работает Denario

Инструменты вроде ChatGPT уже могут помочь в некоторых аспектах научного процесса: например, визуализировать данные или написать аннотации. Однако такие инструменты обычно ограничены одним шагом.

С помощью Denario учёные разработали новый тип помощника: тот, который может синтезировать существующие статьи, формулировать новые вопросы для исследований, анализировать данные и писать рукописи.

В статье, опубликованной на сервере препринтов arXiv, создатели Denario — под руководством Университета Кембриджа, Института Флэтiron и Автономного университета Барселоны — представляют обзор инструмента и предполагают, что Denario может ускорить и расширить научный процесс, давая учёным возможность использовать его для наиболее полезных аспектов.

«Иногда самое интересное — это идея, потому что это может быть новая идея, которая ещё не была исследована», — сказал Франсиско Вильяэскуса-Наварро из Института Флэтiron и один из основных разработчиков Denario. «Иногда это новый метод, который никогда не применялся к определённому набору данных. Есть много способов, с помощью которых Denario может помочь расширить наше мышление и указать нам новые направления».

Команда подчёркивает, что Denario не заменяет учёных. Текущая версия имеет существенные недостатки: только примерно каждый десятый результат даёт интересные идеи, а в некоторых случаях Denario искажал данные. Человеческая проверка работы Denario остаётся важной.

Развитие Denario

Разработкой Denario руководили доктор Борис Боллие из Кембриджа, Пабло Виллануэва Доминго из Автономного университета Барселоны и Вильяэскуса-Наварро. В команду входили исследователи из области астрофизики, биологии, биофизики, химии, материаловедения, нейронауки, математики, машинного обучения, квантовой физики и философии.

С недавними достижениями в области больших языковых моделей, таких как ChatGPT, Google Gemini и Claude от Anthropic, исследователи увидели возможность проверить, как такие инструменты могут работать на каждом этапе исследовательского процесса.

Denario использует набор «агентов» искусственного интеллекта, каждый из которых специализируется на определённой задаче. Хотя Denario может завершить весь исследовательский процесс от начала до конца, агентов также можно использовать отдельно для конкретных шагов.

«Мы разработали Denario с модульной архитектурой, чтобы пользователи могли выбрать, какие из его компонентов лучше всего подходят для их исследований, будь то кодирование, изучение исследовательских идей, обобщение результатов или что-то ещё», — сказал Боллие из Лаборатории Кавендиша в Кембридже.

Чтобы использовать Denario от начала до конца, учёные загружают набор данных вместе с кратким описанием того, что они хотели бы с ним сделать. Первая пара агентов разрабатывает и уточняет идеи о том, как лучше всего подойти к набору данных, генерируя потенциальные исследовательские проекты. Следующий набор ищет существующие научные работы по теме, чтобы убедиться, что идея проекта нова и основана на предыдущих исследованиях.

После того как идея уточнена, агенты методов и планировщики предлагают подходы для анализа данных. Следующие агенты выполняют эти планы, используя многоагентную систему под названием CMBAgent, которая действует как аналитическая система поддержки исследований Denario. Эти агенты пишут, отлаживают и запускают код, затем интерпретируют результаты. Наконец, модули написания и рецензирования создают и редактируют краткие изложения результатов.

«Все агенты работают вместе, чтобы сделать это возможным», — сказал Виллануэва Доминго, подчеркнув, что учёные могут легко проверить работу каждого модуля и при желании запустить агентов по отдельности.

Пока что Denario тестировался сотни раз на наборах данных в различных дисциплинах, включая астрофизику, нейронауку, химию, биологию и материаловедение. Большинство результатов были признаны непригодными в ходе экспертных обзоров, но около 10% дали интересный вопрос или открытие.

Поскольку Denario может опираться на несколько дисциплин, команда надеется, что он сможет определить новые вопросы для исследований, о которых специалист мог бы никогда не подумать.

«Denario может черпать идеи из других областей, с которыми учёный, возможно, менее знаком и которые никогда не рассматривал бы», — сказал Виллануэва Доминго. «Такая междисциплинарность очень интересна».

Исследователи также надеются, что Denario поможет учёным вернуть один из их самых ценных ресурсов: время.

«Я надеюсь, что Denario поможет ускорить науку, предоставив исследователям инструменты, которые позволят им тратить меньше времени на рутинные задачи — такие как просмотр arXiv, форматирование изображений, обобщение анализа — и больше времени на глубокое творческое мышление», — сказал Боллие.

В следующей версии команда стремится сделать Denario более эффективным и способным создавать более качественную работу, включая автоматическую идентификацию и фильтрацию некачественных результатов.

Инструменты вроде Denario всё ещё сталкиваются с проблемами. Некоторые итоговые отчёты системы не смогли адекватно передать неопределённость в результатах, и иногда ей было трудно ссылаться на предыдущие исследования, даже когда она могла точно описать их содержание.

Существуют также технические и этические соображения, включая риск того, что Denario будет опираться на «галлюцинации» искусственного интеллекта — вводящую в заблуждение или ложную информацию, а также вопросы об авторском праве и авторстве. Исследователям даже пришлось добавить инструкцию, запрещающую Denario генерировать «фиктивные данные» после того, как он выдал сфабрикованные результаты.

Команда говорит, что они надеются на открытое обсуждение о том, как лучше всего использовать Denario и подобные инструменты в научном процессе, а также о том, как предотвратить потенциальное неправильное использование. Они подчёркивают, что Denario стал возможен только благодаря сотрудничеству между академическими кругами и промышленностью.

Источник