CopilotKit v1.50: внедрение агентов AG-UI прямо в ваше приложение с помощью нового хука useAgent

Современные фреймворки агентов уже умеют работать с логикой и инструментами, но большинство команд всё ещё пишут собственный код, чтобы превратить графы агентов в надёжные пользовательские интерфейсы с общим состоянием, потоковым выводом и возможностью прерывания. CopilotKit нацелен на решение этой задачи. Это фреймворк с открытым исходным кодом для создания AI-копилотов и агентов внутри приложения прямо в вашем приложении, с контекстом в реальном времени и контролем пользовательского интерфейса (🔍).

Основные моменты версии 1.50 CopilotKit

С выпуском CopilotKit v1.50 проект перестроен на основе протокола взаимодействия с пользователем Agent User Interaction Protocol (AG-UI) изначально. Ключевая идея проста: пусть AG-UI определяет весь трафик между агентами и пользовательскими интерфейсами как типизированный поток событий в любое приложение через единый хук — useAgent.

useAgent — это хук React для каждого агента AG-UI. AG-UI определяет, как бэкенд агента и фронтенд обмениваются единой упорядоченной последовательностью событий, закодированных в формате JSON. Эти события включают сообщения, вызовы инструментов, обновления состояния и сигналы жизненного цикла, и они могут передавать любые данные по транспорту, например, HTTP, Web Sockets или даже WebRTC.

CopilotKit v1.50 использует этот протокол в качестве собственного транспортного уровня. Вместо отдельных адаптеров для каждой платформы теперь всё взаимодействует через AG-UI напрямую. Это стало возможным благодаря новому хуку useAgent — хуку React, который обеспечивает программный контроль над любым агентом AG-UI.

Как работает хук useAgent

React-компонент делает три вещи:
1. Вызывает useAgent с деталями подключения к бэкенд-агенту.
2. Читает текущее состояние, такое как список сообщений, дельты потоковой передачи и флаги состояния агента.
3. Вызывает методы useAgent из хука для отправки пользовательских сообщений, запуска инструментов или обновления общего состояния.

Поскольку хук зависит только от AG-UI, один и тот же код пользовательского интерфейса может работать с разными фреймворками агентов, если они предоставляют конечную точку AG-UI.

Контекстное взаимодействие и общее состояние

AG-UI предполагает, что приложения с агентами имеют состояние. Протокол стандартизирует, как контекст перемещается между пользовательским интерфейсом и агентом.

На фронтенде CopilotKit уже позволяет разработчикам регистрировать данные приложения как контекст, например, с помощью хуков, которые делают части состояния React доступными для агента. В модели AG-UI это становится явным. Снимки состояния и события патча состояния синхронизируют бэкенд и пользовательский интерфейс. Агент видит согласованное представление приложения, а пользовательский интерфейс может отображать то же состояние без специальной логики синхронизации.

Для инженера начального уровня это устраняет общий шаблон. Больше не нужно вручную вставлять пропсы в подсказки при каждом вызове. Состояние обновляется, и клиент AG-UI кодирует эти обновления как события, а бэкенд-агент потребляет то же состояние через свою библиотеку AG-UI.

AG-UI: протокол взаимодействия между агентами и пользователями

AG-UI определён как открытый, лёгкий протокол, который стандартизирует подключение агентов к приложениям, ориентированным на пользователя. Он фокусируется на семантике событий, а не на транспорте. Основные SDK предоставляют строго типизированные модели событий и клиенты на TypeScript, Python и других языках.

Пакет JavaScript @ag-ui/core реализует архитектуру потоковой передачи событий на стороне клиента. Он предоставляет модели сообщений и состояний, типы входных данных и служебные программы для событий.

На стороне Python пакет ag-ui-protocol предоставляет канонические модели событий. CopilotKit v1.50 строится непосредственно на этих компонентах.

Интеграции первого уровня в трёх гиперскейлерах

В обзоре AG-UI перечислены Microsoft Agent Framework, Google Agent Development Kit, ADK и AWS Strands Agents как поддерживаемые фреймворки, каждый из которых имеет выделенную документацию и демонстрации. Это интеграции первого уровня, поддерживаемые владельцами протокола и фреймворков.

Microsoft опубликовала руководство, которое показывает, как создавать серверные и клиентские приложения, используя AG-UI с Agent Framework в .NET или Python. Google документирует AG-UI в разделе Agentic UI в документации ADK, а CopilotKit предоставляет полное руководство по созданию ADK вместе со стеком AG-UI и CopilotKit. AWS Strands предоставляет интеграцию AG-UI через официальные учебные пособия и краткое руководство по CopilotKit, которое подключает бэкенд агента Strands к клиенту React в одном проекте.

Для команды React это означает, что useAgent может подключаться к агентам, определённым в любом из этих фреймворков, если бэкенд предоставляет конечную точку AG-UI. Код фронтенда остаётся прежним, а логика агента и среда хостинга могут меняться.

Рост экосистемы вокруг CopilotKit и AG-UI

CopilotKit позиционирует себя как агентскую платформу для копилотов в приложении, с более чем 20 000 звёздами GitHub и доверием более чем 100 000 разработчиков.

AG-UI перешёл от предложения протокола к общему слою в нескольких фреймворках. Партнёрства или интеграции включают LangGraph, CrewAI, Mastra, Pydantic AI, Agno, LlamaIndex и другие, а также SDK на Kotlin, Go, Java, Rust и других языках.

Ключевые выводы

* CopilotKit v1.50 стандартизирует свой фронтенд-уровень на AG-UI, поэтому вся коммуникация между агентом и пользовательским интерфейсом представляет собой единый поток событий, а не отдельные ссылки для каждого бэкенда.
* Новый хук React useAgent позволяет компоненту подключаться к любому агенту, совместимому с AG-UI, и предоставляет сообщения, потоковые токены, инструменты и общее состояние через типизированный интерфейс.
* AG-UI формализует контекстное взаимодействие и общее состояние как реплицируемые хранилища с событийными дельтами, так что и агент, и пользовательский интерфейс имеют согласованное представление приложения без ручной настройки подсказок.
* AG-UI имеет интеграции первого уровня с Microsoft Agent Framework, Google Agent Development Kit и AWS Strands Agents, что означает, что один и тот же код пользовательского интерфейса CopilotKit может нацеливаться на агентов во всех трёх основных облаках.
* CopilotKit и AG-UI демонстрируют сильную экосистемную динамику, с высоким уровнем принятия на GitHub и значительными еженедельными загрузками для @ag-ui/core на npm и ag-ui-protocol на PyPI, что сигнализирует о том, что протокол становится общим слоем для агентских приложений.

1. Какие проблемы решает CopilotKit v1.50 и как он упрощает разработку AI-копилотов и агентов внутри приложения?

CopilotKit v1.50 решает задачу превращения графов агентов в надёжные пользовательские интерфейсы с общим состоянием, потоковым выводом и возможностью прерывания. Он упрощает разработку AI-копилотов и агентов внутри приложения, предоставляя единый хук React — useAgent, который обеспечивает программный контроль над любым агентом AG-UI.

2. Какие основные моменты характеризуют версию 1.50 CopilotKit?

Основные моменты версии 1.50 CopilotKit включают:
* перестроение проекта на основе протокола взаимодействия с пользователем Agent User Interaction Protocol (AG-UI);
* использование AG-UI в качестве транспортного уровня;
* введение нового хука useAgent — хука React, который обеспечивает программный контроль над любым агентом AG-UI;
* стандартизация фронтенд-уровня на AG-UI.

3. Как работает хук useAgent в CopilotKit v1.50?

Хук useAgent в CopilotKit v1.50 работает следующим образом:
* React-компонент вызывает useAgent с деталями подключения к бэкенд-агенту;
* читает текущее состояние, такое как список сообщений, дельты потоковой передачи и флаги состояния агента;
* вызывает методы useAgent из хука для отправки пользовательских сообщений, запуска инструментов или обновления общего состояния.

4. Какие интеграции первого уровня поддерживает CopilotKit v1.50?

CopilotKit v1.50 поддерживает интеграции первого уровня с Microsoft Agent Framework, Google Agent Development Kit, ADK и AWS Strands Agents. Это означает, что код фронтенда CopilotKit может нацеливаться на агентов во всех трёх основных облаках.

5. Какие ключевые выводы можно сделать о CopilotKit v1.50 и AG-UI?

Ключевые выводы о CopilotKit v1.50 и AG-UI включают:
* CopilotKit v1.50 стандартизирует свой фронтенд-уровень на AG-UI, что упрощает коммуникацию между агентом и пользовательским интерфейсом.
* Новый хук React useAgent позволяет компоненту подключаться к любому агенту, совместимому с AG-UI, и предоставляет сообщения, потоковые токены, инструменты и общее состояние через типизированный интерфейс.
* AG-UI формализует контекстное взаимодействие и общее состояние как реплицируемые хранилища с событийными дельтами, что обеспечивает согласованное представление приложения без ручной настройки подсказок.

Источник