ИИ и изменение климата: как надёжно фиксировать выбросы парниковых газов

Крупные компании в ЕС обязаны предоставлять отчётность о своих выбросах парниковых газов (ПГ). Однако вручную извлекать эту информацию из длинных PDF-отчётов об устойчивом развитии — медленно и чревато ошибками. Многие команды пытаются ускорить процесс с помощью автоматизации, например, используя большие языковые модели (LLM) — системы искусственного интеллекта, которые читают текст и выдают ответы.

Координатор проекта и постдокторант в лаборатории социальных данных и искусственного интеллекта (SODA Lab) доктор Мальте Ширхольц, однако, призывает к осторожности. «При использовании методов автоматического извлечения легко полностью довериться результату LLM и упустить из виду ошибки измерений, которые возникают часто».

Поскольку тенденция к повышению автоматизации перспективна, но в то же время рискованна, исследовательская группа Greenhouse Gas Insights and Sustainability Tracking (GIST) поставила перед собой задачу создать надёжный ориентир для сбора данных о выбросах.

В статье, опубликованной в Scientific Data, группа представляет эталонный набор данных для извлечения выбросов ПГ. Набор данных основан на отчётах об устойчивом развитии, взятых из компаний, входящих в индекс MSCI World Small Cap и немецкий DAX.

«Основная задача заключалась в том, чтобы извлечь значения выбросов ПГ из PDF-файлов в таблицу», — говорит Ширхольц. «То, что сначала казалось простым, оказалось на удивление сложным».

В многоэтапном процессе эксперты в области устойчивого финансирования из LMU и Deutsche Bundesbank работали с методологами, чтобы определить строгие правила аннотирования, провели несколько раундов извлечения и проверки, а также созвали группы экспертов для обсуждения.

«Если вы хотите получить набор данных, который будет точным и позволит сравнивать компании, вам нужны чёткие правила и множество циклов обратной связи на протяжении всего процесса аннотирования данных», — говорит Джейкоб Бек, который руководил усилиями по аннотированию. «В конце концов, некоторые неоднозначные случаи всё ещё требовали обсуждения в группе экспертов».

Исследователь в области устойчивого финансирования доктор Андреас Диммельмайер (консорциум GreenDIA) не был удивлён. «Случаи, которые трудно разрешить, возникают не только из-за сложных и частично противоречивых протоколов отчётности, но и из-за отсутствия контекста и неполного раскрытия информации в отчётах компаний. Многие компании в нашей выборке не раскрывали данные о выбросах в соответствии с установленными протоколами отчётности и расчётов».

Команда также отметила, что примерно в половине отчётов вообще не было полезных данных о парниковых газах. Когда выбросы фиксировались, чаще всего речь шла о прямых выбросах и косвенных выбросах от потребления энергии. Данные о других косвенных выбросах, таких как выбросы в цепочке поставок или от поездок и транспорта, редко были полными.

Набор данных вместе со скриптами и дополнительными материалами предлагает прозрачную, тщательно отобранную основу для оценки автоматизированных подходов к отчётности об устойчивом развитии. Делая предположения и решения явными, он позволяет сравнивать методы и чётче передавать информацию о неопределённости аннотирования. Группа GIST надеется, что этот ресурс поможет исследователям и практикам более честно измерять прогресс и устранять критические пробелы в данных на пути к нулевым выбросам.

Предоставлено
Людвиг-Максимилиановский университет Мюнхена

Источник