Исследование Google представляет причинную структуру для более надёжной интерпретации справедливости подгрупп в оценках машинного обучения

Понимание справедливости подгрупп в машинном обучении (ML)

Оценка справедливости в машинном обучении часто включает анализ того, как модели работают с разными подгруппами, определёнными по таким атрибутам, как раса, пол или социально-экономический статус. Такая оценка важна в таких областях, как здравоохранение, где неравная производительность модели может привести к различиям в рекомендациях по лечению или диагностике.

Анализ производительности на уровне подгрупп помогает выявить непреднамеренные предубеждения, которые могут быть заложены в данных или дизайне модели. Для этого требуется тщательная интерпретация, поскольку справедливость — это не только статистическое равенство, но и обеспечение того, чтобы прогнозы приводили к справедливым результатам при внедрении в реальных системах.

Распределение данных и структурное смещение

Основная проблема возникает, когда производительность модели различается в подгруппах не из-за предвзятости самой модели, а из-за реальных различий в распределении данных подгрупп. Эти различия часто отражают более широкие социальные и структурные неравенства, которые формируют данные, используемые для обучения и оценки моделей.

В таких сценариях требование равной производительности в подгруппах может привести к неверной интерпретации. Кроме того, если данные, используемые для разработки модели, не репрезентативны для целевой популяции из-за предвзятости выборки или структурных исключений, модели могут плохо обобщаться.

Ограничения традиционных показателей справедливости

Текущие оценки справедливости часто включают дезагрегированные показатели или условные тесты независимости. Эти показатели широко используются для оценки алгоритмической справедливости, включая точность, чувствительность, специфичность и положительную прогностическую ценность в различных подгруппах.

Однако эти методы могут привести к ошибочным выводам при наличии сдвигов в распределении. Если распространённость меток различается среди подгрупп, даже точные модели могут не соответствовать определённым критериям справедливости, что приводит к тому, что практики предполагают наличие предвзятости там, где её нет.

Причинная структура для оценки справедливости

Исследователи из Google Research, Google DeepMind, Нью-Йоркского университета, Массачусетского технологического института, Детской больницы Торонто и Стэнфордского университета представили новую структуру, которая улучшает оценку справедливости.

Исследование представило причинно-следственные графические модели, которые явно моделируют структуру генерации данных, включая то, как различия в подгруппах и смещения выборки влияют на поведение модели. Этот подход позволяет избежать предположений о равномерных распределениях и обеспечивает структурированный способ понимания того, как меняется производительность подгрупп.

Исследователи предлагают сочетать традиционные дезагрегированные оценки с причинно-следственным анализом, призывая пользователей критически осмысливать источники различий между подгруппами, а не полагаться исключительно на сравнение показателей.

Типы моделируемых сдвигов распределения

Структура классифицирует типы сдвигов, такие как сдвиг ковариат, сдвиг результатов и сдвиг представления, с помощью причинно-следственных ациклических графов. Эти графы включают ключевые переменные, такие как принадлежность к подгруппе, результат и ковариаты.

Например, сдвиг ковариат описывает ситуации, когда распределение признаков различается в подгруппах, но связь между результатом и признаками остаётся постоянной. Сдвиг результата, напротив, фиксирует случаи, когда связь между признаками и результатами меняется в зависимости от подгруппы.

Эмпирическая оценка и результаты

В своих экспериментах команда оценила байесовские оптимальные модели в различных причинных структурах, чтобы изучить, когда выполняются условия справедливости, такие как достаточность и разделение. Они обнаружили, что достаточность выполняется при сдвиге ковариат, но не при других типах сдвигов, таких как сдвиг результата или сложный сдвиг.

Анализ также показал, что когда предвзятость отбора зависит только от таких переменных, как X или A, критерии справедливости всё ещё могут быть соблюдены. Однако, когда отбор зависит от Y или комбинаций переменных, поддержание справедливости подгрупп становится более сложной задачей.

Заключение и практические выводы

Это исследование проясняет, что справедливость нельзя точно оценить только с помощью показателей подгрупп. Различия в производительности могут быть связаны с базовыми структурами данных, а не с предвзятыми моделями.

Предложенная причинная структура предоставляет практикам инструменты для обнаружения и интерпретации этих нюансов. Моделируя причинно-следственные связи явно, исследователи обеспечивают путь к оценкам, которые отражают как статистические, так и реальные проблемы, связанные со справедливостью.

Метод не гарантирует идеального равенства, но даёт более прозрачную основу для понимания того, как алгоритмические решения влияют на разные группы населения.

Источник

Оставьте комментарий