Переосмысление выполнения задач с помощью ИИ-агентов
ИИ-агенты меняют подход к выполнению задач, предлагая инструменты для решения сложных задач, направленных на достижение цели. В отличие от статических алгоритмов, эти агенты сочетают многоэтапное планирование с программными инструментами для управления целыми рабочими процессами в различных секторах, включая образование, юриспруденцию, финансы и логистику. Их интеграция больше не является теоретической — работники уже применяют их для выполнения различных профессиональных обязанностей. В результате формируется трудовая среда, где границы сотрудничества человека и машины пересматриваются ежедневно.
Преодоление разрыва между возможностями ИИ и предпочтениями работников
Постоянной проблемой в этой трансформации является разрыв между тем, что могут делать ИИ-агенты, и тем, что работники хотят, чтобы они делали. Даже если ИИ-системы технически способны взять на себя задачу, работники могут не поддержать такой переход из-за опасений по поводу удовлетворённости работой, сложности задач или важности человеческого суждения.
Тем временем задачи, которые работники хотят передать, могут не иметь зрелых ИИ-решений. Это несоответствие представляет собой серьёзное препятствие для ответственного и эффективного внедрения ИИ в рабочую силу.
Комплексная оценка рабочей силы
До недавнего времени оценки внедрения ИИ часто сосредотачивались на нескольких ролях, таких как разработка программного обеспечения или обслуживание клиентов, ограничивая понимание того, как ИИ влияет на более широкое профессиональное разнообразие. Большинство из этих подходов также отдавали приоритет производительности компании над опытом работников. Они основывались на анализе текущих моделей использования, который не обеспечивает перспективного взгляда.
В результате разработка инструментов ИИ не имела комплексной основы, основанной на реальных предпочтениях и потребностях людей, выполняющих работу.
База данных WORKBank от Стэнфордского университета: сбор мнений реальных работников
Исследовательская группа из Стэнфордского университета представила систему аудита, основанную на опросах, которая оценивает, какие задачи работники предпочли бы автоматизировать или расширить возможности ИИ, и сравнивает это с экспертными оценками возможностей ИИ.
Используя данные о задачах из базы данных Министерства труда США O*NET, исследователи создали WORKBank — набор данных, основанный на ответах 1500 отраслевых работников и оценках 52 экспертов в области ИИ. Команда использовала мини-интервью с аудиоподдержкой для сбора детальных предпочтений.
Было введено понятие шкалы человеческого участия (HAS) — пятиуровневой метрики, которая отражает желаемую степень участия человека в выполнении задачи.
Шкала человеческого участия (HAS): измерение правильного уровня участия ИИ
В центре этой системы находится шкала человеческого участия, которая варьируется от H1 (полный контроль ИИ) до H5 (полный контроль человека). Этот подход признаёт, что не все задачи выигрывают от полной автоматизации, и не каждая ИИ-система должна стремиться к ней.
Например, задачи, оценённые как H1 или H2, такие как транскрибирование данных или создание рутинных отчётов, хорошо подходят для независимого выполнения ИИ. Между тем, такие задачи, как планирование программ обучения или участие в обсуждениях, связанных с безопасностью, часто оценивались на уровне H4 или H5, что отражает высокий спрос на человеческий контроль.
Исследователи собрали двойные входные данные: работники оценили своё желание автоматизации и предпочтительный уровень HAS для каждой задачи, в то время как эксперты оценили текущие возможности ИИ для выполнения этой задачи.
Выводы из WORKBank: где работники принимают ИИ или сопротивляются ему
Результаты, полученные из базы данных WORKBank, выявили чёткие закономерности. Примерно 46,1% задач получили высокую оценку автоматизации со стороны работников, особенно те, которые рассматривались как малоценные или повторяющиеся.
Сопротивление было обнаружено в задачах, связанных с творчеством или межличностной динамикой, независимо от технической способности ИИ выполнять их.
Наложив предпочтения работников и возможности экспертов, задачи были разделены на четыре зоны:
* Зона «зелёного света» для автоматизации (высокая способность и высокое желание);
* Зона «красного света» для автоматизации (высокая способность, но низкое желание);
* Зона возможностей для исследований и разработок (низкая способность, но высокое желание);
* Зона с низким приоритетом (низкое желание и низкая способность).
41% задач, связанных с компаниями, финансируемыми Y Combinator, попали в зоны с низким приоритетом или «красным светом», что указывает на потенциальное несоответствие между инвестициями стартапов и потребностями работников.
На пути к ответственному внедрению ИИ в рабочую силу
Это исследование предлагает чёткую картину того, как можно более ответственно подойти к интеграции ИИ. Команда Стэнфорда выявила не только там, где автоматизация технически осуществима, но и там, где работники восприимчивы к ней.
Их система на уровне задач выходит за рамки технической готовности и охватывает человеческие ценности, что делает её ценным инструментом для разработки ИИ, политики в области труда и стратегий обучения рабочей силы.
TL;DR:
В этой статье представлен WORKBank — крупномасштабный набор данных, сочетающий предпочтения работников и оценки экспертов в области ИИ по 844 задачам и 104 профессиям, для оценки того, где ИИ-агенты должны автоматизировать или расширить рабочие процессы.
Используя новую шкалу человеческого участия (HAS), исследование выявляет сложную картину автоматизации, подчёркивая несоответствие между техническими возможностями и желанием работников. Результаты показывают, что работники приветствуют автоматизацию повторяющихся задач, но сопротивляются ей в сферах, требующих творчества или межличностных навыков.
Система предлагает практические идеи для ответственного внедрения ИИ, соответствующего человеческим ценностям.
1. Какие основные проблемы возникают при внедрении ИИ в рабочие процессы и как они решаются в исследовании Стэнфордского университета?
В исследовании Стэнфордского университета отмечается, что одна из основных проблем при внедрении ИИ в рабочие процессы — это разрыв между тем, что могут делать ИИ-агенты, и тем, что работники хотят, чтобы они делали. Для решения этой проблемы исследователи создали систему аудита, основанную на опросах, которая оценивает, какие задачи работники предпочли бы автоматизировать или расширить возможности ИИ, и сравнивает это с экспертными оценками возможностей ИИ.
2. Какие задачи работники предпочли бы автоматизировать с помощью ИИ, а какие — оставить под контролем человека?
Согласно результатам исследования, работники приветствуют автоматизацию повторяющихся задач, таких как транскрибирование данных или создание рутинных отчётов. Однако они сопротивляются автоматизации задач, связанных с творчеством или межличностной динамикой, независимо от технической способности ИИ выполнять их.
3. Как шкала человеческого участия (HAS) помогает определить правильный уровень участия ИИ в выполнении задач?
Шкала человеческого участия (HAS) — это пятиуровневая метрика, которая отражает желаемую степень участия человека в выполнении задачи. Она варьируется от H1 (полный контроль ИИ) до H5 (полный контроль человека). Этот подход признаёт, что не все задачи выигрывают от полной автоматизации, и не каждая ИИ-система должна стремиться к ней.
4. Какие зоны были выделены в результате исследования и что они означают?
Задачи были разделены на четыре зоны:
* Зона «зелёного света» для автоматизации (высокая способность и высокое желание);
* Зона «красного света» для автоматизации (высокая способность, но низкое желание);
* Зона возможностей для исследований и разработок (низкая способность, но высокое желание);
* Зона с низким приоритетом (низкое желание и низкая способность).
5. Какие выводы можно сделать из результатов исследования о потенциале ответственного внедрения ИИ в рабочую силу?
Исследование предлагает чёткую картину того, как можно более ответственно подойти к интеграции ИИ. Команда Стэнфорда выявила не только там, где автоматизация технически осуществима, но и там, где работники восприимчивы к ней. Их система на уровне задач выходит за рамки технической готовности и охватывает человеческие ценности, что делает её ценным инструментом для разработки ИИ, политики в области труда и стратегий обучения рабочей силы.