Новое исследование, проведённое совместно Оксфордским университетом и Google Cloud, показало, как искусственный интеллект общего назначения может точно классифицировать реальные изменения в ночном небе — например, взрывающуюся звезду, чёрную дыру, разрывающую проходящую звезду, быстро движущийся астероид или кратковременную звёздную вспышку из компактной звёздной системы — и объяснять свою логику без необходимости сложного обучения.
Основные выводы исследования
Исследование, опубликованное в журнале Nature Astronomy, демонстрирует, что большая языковая модель общего назначения (LLM) от Google — Gemini — может быть преобразована в экспертного помощника по астрономии с минимальным руководством.
Используя всего 15 примеров изображений и простой набор инструкций, Gemini научилась отличать реальные космические события от артефактов изображений с точностью примерно 93%. Что особенно важно, ИИ также предоставил понятное объяснение каждой классификации — важный шаг к тому, чтобы сделать науку, основанную на ИИ, более прозрачной и заслуживающей доверия, а также к созданию доступных инструментов, не требующих обширных обучающих наборов данных или глубоких знаний в программировании ИИ.
«Поражает, что несколько примеров и чёткие текстовые инструкции могут обеспечить такую точность», — сказал доктор Фиоренцо Стоппа, соавтор исследования из физического факультета Оксфордского университета. «Это позволяет широкому кругу учёных разрабатывать собственные классификаторы без глубоких знаний в области обучения нейронных сетей — только желание создать их».
Как это работает
Современные телескопы непрерывно сканируют небо, генерируя миллионы оповещений каждую ночь о потенциальных изменениях. Хотя некоторые из них являются настоящими открытиями, такими как взрывы звёзд, подавляющее большинство — это «ложные» сигналы, вызванные следами спутников, ударами космических лучей или другими инструментальными артефактами.
Традиционно астрономы полагались на специализированные модели машинного обучения для фильтрации этих данных. Однако эти системы часто работают как «чёрный ящик», предоставляя простой ярлык «реальный» или «ложный» без объяснения своей логики. Это вынуждает учёных либо слепо доверять результатам, либо тратить бесчисленные часы на ручную проверку тысяч кандидатов — задача, которая станет невыполнимой с появлением нового поколения телескопов, таких как обсерватория Веры Рубин, которая будет выдавать около 20 терабайт данных каждые 24 часа.
Исследовательская группа задалась вопросом: может ли ИИ общего назначения, мультимодальный ИИ, такой как Gemini, разработанный для понимания текста и изображений, не только соответствовать точности специализированных моделей, но и объяснять, что он видит?
Результаты
Команда предоставила LLM всего 15 помеченных примеров для каждого из трёх основных обзоров неба (ATLAS, MeerLICHT и Pan-STARRS). Каждый пример включал небольшое изображение нового оповещения, эталонное изображение того же участка неба и «разностное» изображение, подчёркивающее изменение, а также краткую экспертную заметку.
Руководствуясь лишь этими примерами и краткими инструкциями, модель классифицировала тысячи новых оповещений, предоставляя метку (реальный/ложный), оценку приоритета и краткое, понятное описание своего решения.
Ключевым компонентом исследования была проверка качества и полезности объяснений ИИ. Команда собрала группу из 12 астрономов для ознакомления с описаниями ИИ, которые оценили их как высоко согласованные и полезные.
Более того, в параллельном тесте команда попросила Gemini просмотреть свои собственные ответы и присвоить каждому из них оценку согласованности. Они обнаружили, что уверенность модели является мощным индикатором её точности: выводы с низкой согласованностью с гораздо большей вероятностью были неверными. Эта возможность самопроверки имеет решающее значение для построения надёжного рабочего процесса «человек в контуре».
Используя этот цикл самокоррекции для уточнения начальных примеров, команда улучшила производительность модели на одном наборе данных с ~93,4% до ~96,7%, продемонстрировав, как система может учиться и совершенствоваться в сотрудничестве с экспертами-людьми.
Профессор Стивен Смартт (физический факультет Оксфордского университета) сказал: «Я работал над проблемой быстрой обработки данных из обзоров неба более 10 лет, и мы постоянно сталкиваемся с необходимостью отсеивать реальные события из ложных сигналов при обработке данных. Мы потратили годы на обучение моделей машинного обучения, нейронных сетей для распознавания изображений».
«Однако точность LLM в распознавании источников при минимальном руководстве, а не при обучении для конкретной задачи, была поразительной. Если мы сможем разработать масштабирование этого подхода, это может полностью изменить правила игры в этой области, став ещё одним примером того, как ИИ способствует научным открытиям».
Команда представляет эту технологию как основу для автономных «агентских помощников» в науке. Такие системы могут делать гораздо больше, чем классифицировать одно изображение; они могут интегрировать несколько источников данных (например, изображения и измерения яркости), проверять свою уверенность, автономно запрашивать последующие наблюдения у роботизированных телескопов и передавать только наиболее многообещающие и необычные открытия учёным-людям.
Поскольку метод требует лишь небольшого набора примеров и инструкций на простом языке, его можно быстро адаптировать для новых научных инструментов, обзоров и исследовательских целей в разных областях.
«Мы вступаем в эпоху, когда научные открытия ускоряются не чёрными ящиками алгоритмов, а прозрачными партнёрами по ИИ», — сказал Туран Булмус, соавтор исследования из Google Cloud. «Эта работа показывает путь к созданию систем, которые учатся вместе с нами, объясняют свои рассуждения и дают исследователям в любой области возможность сосредоточиться на самом главном: задании следующего великого вопроса».