От автоматизации бэкенда к совместной работе фронтенда: что нового в последнем обновлении AG-UI для взаимодействия агентов ИИ с пользователями

Введение

Агенты ИИ всё чаще переходят от чистой автоматизации бэкенда к видимым, совместным элементам в современных приложениях. Однако сделать агентов по-настоящему интерактивными — способными как реагировать на пользователей, так и активно направлять рабочие процессы — долгое время было инженерной задачей. Каждая команда в итоге создаёт собственные каналы связи, обработку событий и управление состоянием — и всё это для схожих потребностей взаимодействия.

Первый выпуск AG-UI, анонсированный в мае 2025 года, стал практическим доказательством концепции протокола для встроенного взаимодействия агентов и пользователей с открытым исходным кодом. Он представил однопоточную архитектуру — обычно HTTP POST в сочетании с Server-Sent Events (SSE) — и установил словарь структурированных событий JSON (например, TEXTMESSAGECONTENT, TOOLCALLSTART, STATE_DELTA), которые могли бы управлять интерактивными фронтенд-компонентами.

Первая версия решала основные задачи интеграции — потоковая передача в реальном времени, координация инструментов, общее состояние и стандартизированная обработка событий — но пользователи обнаружили, что для более широкого использования в производстве необходима дальнейшая формализация типов событий, версионирование и поддержка фреймворка.

Последнее обновление AG-UI предлагает другой подход. Вместо очередного набора инструментов оно предлагает лёгкий протокол, который стандартизирует общение между агентами и пользовательскими интерфейсами. Эта новая версия приближает протокол к производственному качеству, улучшает ясность событий и расширяет совместимость с реальными фреймворками агентов и клиентами.

Что отличает последнее обновление AG-UI

Последнее обновление AG-UI — это постепенный, но значимый шаг для приложений, управляемых агентами. В отличие от более ранних специальных попыток обеспечить интерактивность, последнее обновление AG-UI построено на основе явных, версионированных событий. Протокол не привязан жёстко к какому-либо конкретному стеку; он разработан для работы с несколькими бэкендами агентов и типами клиентов «из коробки».

Ключевые особенности последнего обновления AG-UI включают:
* Формальный набор из примерно 16 типов событий, охватывающих полный жизненный цикл агента — потоковая передача выходных данных, вызовы инструментов, обновления состояния, подсказки пользователей и обработка ошибок.
* Более чёткие схемы событий, позволяющие клиентам и агентам согласовывать возможности и более надёжно синхронизировать состояние.
* Более надёжная поддержка как прямой (нативной) интеграции, так и обёртывания устаревших агентов с помощью адаптеров.
* Расширенная документация и SDK, которые делают протокол практичным для использования в производстве, а не только для экспериментов.

Интерактивные агенты требуют согласованности

Многие агенты ИИ сегодня остаются скрытыми в бэкенде, предназначенные для обработки запросов и возврата результатов, с небольшим учётом взаимодействия в реальном времени с пользователем. Чтобы сделать агентов интерактивными, необходимо решить несколько технических задач:
* Потоковая передача: агенты должны отправлять инкрементные результаты или сообщения, как только они становятся доступны, а не только в конце процесса.
* Общее состояние: и агент, и пользовательский интерфейс должны оставаться синхронизированными, отражая изменения по мере выполнения задачи.
* Вызовы инструментов: агенты должны иметь возможность запрашивать внешние инструменты (например, API или действия пользователя) и получать результаты обратно структурированным образом.
* Двунаправленный обмен сообщениями: пользователи должны иметь возможность отвечать или направлять агента, а не просто пассивно наблюдать.
* Безопасность и контроль: вызовы инструментов, отмены и сигналы об ошибках должны быть явными и управляться безопасно.

Без общего протокола каждый разработчик в конечном итоге заново изобретает эти механизмы — часто несовершенно.

Как работает последнее обновление AG-UI

Последнее обновление AG-UI формализует взаимодействие между агентом и пользователем как поток типизированных событий. Агенты генерируют эти события во время работы; клиенты подписываются на поток, интерпретируют события и отправляют ответы, когда это необходимо.

Поток событий

Основой последнего обновления AG-UI является таксономия событий. Существует около 16 типов событий, включая:
* message: вывод агента, такой как обновление статуса или фрагмент сгенерированного текста.
* function_call: агент просит клиента запустить функцию или инструмент, часто требуя внешнего ресурса или действия пользователя.
* state_update: синхронизирует переменные или информацию о прогрессе.
* input_request: запрашивает у пользователя значение или выбор.
* tool_result: отправляет результаты из инструментов обратно агенту.
* error and control: сигналы об ошибках, отменах или завершении.

Все события JSON-кодируются, типизируются и версионируются. Эта структура упрощает синтаксический анализ событий, изящную обработку ошибок и добавление новых возможностей с течением времени.

Интеграция агентов и клиентов

Существует два основных шаблона интеграции:
* Native: агенты создаются или модифицируются для прямого генерирования событий AG-UI во время выполнения.
* Adapter: для устаревших или сторонних агентов модуль адаптера может перехватывать выходные данные и переводить их в события AG-UI.

На стороне клиента приложения устанавливают постоянное соединение (обычно через SSE или WebSocket), прослушивают события и обновляют свой интерфейс или отправляют структурированные ответы по мере необходимости.

Протокол намеренно независим от транспорта, но поддерживает потоковую передачу в реальном времени для обеспечения оперативности.

Принятие и экосистема

С момента своего первоначального выпуска AG-UI получил распространение среди популярных фреймворков для оркестрации агентов. Расширенная схема событий и улучшенная документация последней версии AG-UI ускорили усилия по интеграции.

Текущие или находящиеся в процессе интеграции включают:
* LangChain, CrewAI, Mastra, AG2, Agno, LlamaIndex: каждый предлагает оркестрацию для агентов, которые теперь могут интерактивно отображать своё внутреннее состояние и прогресс.
* AWS, A2A, ADK, AgentOps: ведётся работа по объединению облачных инструментов, мониторинга и инструментов управления агентами с AG-UI.
* Human Layer (интеграция со Slack): демонстрирует, как агенты могут стать совместными членами команды в средах обмена сообщениями.

Протокол завоевал популярность среди разработчиков, стремящихся избежать создания собственных обработчиков сокетов и схем событий для каждого проекта. В настоящее время он имеет более 3 500 звёзд GitHub и используется во всё большем числе продуктов, управляемых агентами.

Опыт разработчиков

Последнее обновление AG-UI разработано так, чтобы минимизировать трудности как для разработчиков агентов, так и для фронтенд-инженеров.

SDK и шаблоны: инструмент командной строки CLI npx create-ag-ui-app создаёт проект со всеми зависимостями и примерами интеграций.
Чёткие схемы: события версионированы и задокументированы, что обеспечивает надёжную обработку ошибок и будущую расширяемость.
Практическая документация: руководства по интеграции в реальном мире, примеры потоков и визуальные ресурсы помогают сократить количество проб и ошибок.

Все ресурсы и руководства доступны на AG-UI.com.

Варианты использования

* Встроенные ко-пилоты: агенты, которые работают вместе с пользователями в существующих приложениях, предоставляя предложения и объяснения по мере развития задач.
* Разговорные пользовательские интерфейсы: диалоговые системы, которые поддерживают состояние сеанса и поддерживают многоэтапное взаимодействие с использованием инструментов.
* Автоматизация рабочих процессов: агенты, которые координируют последовательности, включающие как автоматизированные действия, так и шаги с участием человека.

Заключение

Последнее обновление AG-UI предоставляет чётко определённый, лёгкий протокол для создания интерактивных приложений, управляемых агентами. Его событийно-ориентированная архитектура абстрагирует большую часть сложности синхронизации агента и пользователя, обмена данными в реальном времени и управления состоянием. Благодаря явным схемам, широкой поддержке фреймворков и ориентации на практическую интеграцию последнее обновление AG-UI позволяет командам разработчиков создавать более надёжные интерактивные системы ИИ — без повторного решения одних и тех же низкоуровневых задач.

Разработчики, заинтересованные во внедрении последнего обновления AG-UI, могут найти SDK, техническую документацию и интеграционные ресурсы на AG-UI.com.

Источник

Оставьте комментарий