В разработке автономных агентов техническое узкое место смещается с обоснования модели на среду выполнения. Хотя большие языковые модели (LLM) могут генерировать код и многошаговые планы, обеспечение функциональной и изолированной среды для выполнения этого кода остаётся серьёзной задачей для инфраструктуры.
Проект AIO Sandbox от Agent-Infra решает эту проблему, предоставляя «всеобъемлющий» (AIO) уровень выполнения. В отличие от стандартной контейнеризации, которая часто требует ручной настройки для объединения инструментов, AIO Sandbox объединяет браузер, оболочку и файловую систему в единую среду, предназначенную для AI-агентов.
Архитектура «всё в одном»
Основное архитектурное препятствие при разработке агентов — фрагментация инструментов. Обычно агенту может потребоваться браузер для получения данных, интерпретатор Python для их анализа и файловая система для хранения результатов. Управление этими инструментами как отдельными службами приводит к задержкам и сложности синхронизации.
Agent-Infra объединяет эти требования в единую контейнеризованную среду. Песочница включает:
* Взаимодействие с компьютером: браузер Chromium, управляемый через протокол Chrome DevTools (CDP), с документированной поддержкой Playwright.
* Выполнение кода: предварительно настроенные среды выполнения для Python и Node.js.
* Стандартные инструменты: терминал bash и файловая система, доступные для всех модулей.
* Интерфейсы разработки: интегрированные экземпляры сервера VSCode и Jupyter Notebook для мониторинга и отладки.
Единая файловая система
Ключевой технической особенностью Sandbox является её единая файловая система. В стандартном рабочем процессе агент может загрузить файл с помощью инструмента на основе браузера. В фрагментированной настройке этот файл должен быть программно перемещён в отдельную среду для обработки.
AIO Sandbox использует общий уровень хранения. Это означает, что файл, загруженный через браузер Chromium, сразу же становится видимым для интерпретатора Python и оболочки Bash. Это общее состояние позволяет осуществлять переходы между задачами — например, агент может загрузить CSV-файл с веб-портала и сразу же запустить скрипт очистки данных на Python — без внешней обработки данных.
Интеграция протокола Model Context (MCP)
Песочница включает встроенную поддержку протокола Model Context (MCP) — открытого стандарта, облегчающего связь между моделями искусственного интеллекта и инструментами. Предоставляя предварительно настроенные серверы MCP, Agent-Infra позволяет разработчикам предоставлять возможности песочницы для LLM через стандартизированный протокол.
Доступные серверы MCP включают:
* Браузер: для навигации по веб-сайтам и извлечения данных.
* Файл: для операций с единой файловой системой.
* Оболочка: для выполнения системных команд.
* Markitdown: для преобразования форматов документов в Markdown для оптимизации их использования с LLM.
Изоляция и развёртывание
Песочница разработана для «развёртывания корпоративного уровня», ориентированного на изоляцию и масштабируемость. Хотя она обеспечивает постоянную среду для сложных задач — например, для поддержания сеанса терминала в течение нескольких циклов, — она создана достаточно лёгкой для развёртывания с высокой плотностью.
Развёртывание и управление:
* Инфраструктура: проект включает примеры развёртывания Kubernetes (K8s), позволяя командам использовать собственные функции K8s, такие как ограничения ресурсов (ЦП и память), для управления занимаемым песочницей пространством.
* Изоляция контейнеров: выполняя действия агента в выделенном контейнере, песочница обеспечивает уровень разделения между сгенерированным кодом агента и хост-системой.
* Доступ: средой управляет API и SDK, позволяя разработчикам программно запускать команды, выполнять код и управлять состоянием среды.
Техническое сравнение: традиционный Docker против AIO Sandbox
| Характеристика | Традиционный подход Docker | Подход AIO Sandbox (Agent-Infra) |
| — | — | — |
| Архитектура | Обычно мультиконтейнер (один для браузера, один для кода, один для оболочки). | Единый контейнер: браузер, оболочка, Python и IDE (VSCode/Jupyter) в одном времени выполнения. |
| Обработка данных | Требуются монтируемые тома или ручная настройка API для перемещения файлов между контейнерами. | Единая файловая система: файлы изначально доступны совместно. Скачивания через браузер мгновенно видны оболочке/Python. |
| Интеграция агентов | Требует специального «склеивающего кода» для сопоставления действий LLM с командами контейнера. | Встроенная поддержка MCP: предварительно настроенные серверы протокола Model Context для стандартного обнаружения агентов. |
| Пользовательский интерфейс | CLI-based; веб-интерфейсы, такие как VSCode или VNC, требуют значительной ручной настройки. | Встроенные визуальные элементы: интегрированный VNC (для Chromium), сервер VSCode и Jupyter готовы «из коробки». |
| Контроль ресурсов | Управляется через стандартные Docker/K8s cgroups и ограничения ресурсов. | Зависит от базового оркестратора (K8s/Docker) для регулирования ресурсов и ограничений. |
| Подключаемость | Стандартная сетевая настройка Docker; требуется ручная настройка прокси. | Управление браузером на основе CDP: специализированное взаимодействие с браузером через протокол Chrome DevTools. |
| Сохранение состояния | Контейнеры обычно долгоживущие или перезагружаются вручную; управление состоянием осуществляется вручную. | Поддержка сеансов с состоянием: поддержка постоянных терминалов и состояния рабочего пространства в течение жизненного цикла задачи. |
Масштабирование стека агентов
Хотя основная часть Sandbox является открытым исходным кодом (Apache-2.0), платформа позиционируется как масштабируемое решение для команд, создающих сложные рабочие процессы с участием агентов. Уменьшая нагрузку на «Agent Ops» — работу, необходимую для поддержания сред выполнения и устранения конфликтов зависимостей, — песочница позволяет разработчикам сосредоточиться на логике агента, а не на базовой среде выполнения.
Команда Agent-Infra позиционирует AIO Sandbox как стандартизированную, лёгкую среду выполнения для перехода агентов на новый уровень.
Ознакомьтесь с репозиторием [здесь](https://github.com/agent-infra/sandbox?tab=readme-ov-file). Также подписывайтесь на нас в [Twitter](https://twitter.com/) и присоединяйтесь к нашему [ML SubReddit](https://www.reddit.com/r/MachineLearning/) и [подписывайтесь на наш Newsletter](https://agent-infra.github.io/newsletter/). А если вы в Telegram, присоединяйтесь к нам и там!
1. Какие технические проблемы решает проект AIO Sandbox от Agent-Infra при разработке автономных AI-агентов?
Проект AIO Sandbox решает проблему обеспечения функциональной и изолированной среды для выполнения кода AI-агентов. Он объединяет браузер, оболочку и файловую систему в единую среду, предназначенную для AI-агентов, что упрощает разработку и управление ими.
2. Какие ключевые особенности архитектуры AIO Sandbox делают её уникальной по сравнению с традиционной контейнеризацией?
AIO Sandbox имеет несколько ключевых особенностей, которые делают её уникальной:
* единая файловая система, которая позволяет агентам обмениваться данными без необходимости их перемещения между контейнерами;
* встроенная поддержка протокола Model Context (MCP), который облегчает связь между моделями искусственного интеллекта и инструментами;
* интегрированные экземпляры сервера VSCode и Jupyter Notebook для мониторинга и отладки.
3. Какие инструменты и среды выполнения включены в AIO Sandbox для обеспечения полноценной работы AI-агентов?
В AIO Sandbox включены следующие инструменты и среды выполнения:
* браузер Chromium, управляемый через протокол Chrome DevTools (CDP);
* предварительно настроенные среды выполнения для Python и Node.js;
* терминал bash и файловая система, доступные для всех модулей;
* интегрированные экземпляры сервера VSCode и Jupyter Notebook.
4. Как AIO Sandbox обеспечивает изоляцию и масштабируемость при развёртывании на корпоративном уровне?
AIO Sandbox разработана для «развёртывания корпоративного уровня», ориентированного на изоляцию и масштабируемость. Она обеспечивает постоянную среду для сложных задач и создана достаточно лёгкой для развёртывания с высокой плотностью. Проект включает примеры развёртывания Kubernetes (K8s), позволяя командам использовать собственные функции K8s для управления занимаемым песочницей пространством.
5. Какие преимущества предоставляет AIO Sandbox разработчикам AI-агентов по сравнению с традиционным подходом Docker?
AIO Sandbox предоставляет разработчикам AI-агентов несколько преимуществ по сравнению с традиционным подходом Docker:
* упрощение обработки данных за счёт единой файловой системы;
* встроенная поддержка MCP для стандартного обнаружения агентов;
* более удобный пользовательский интерфейс с встроенными визуальными элементами;
* поддержка сеансов с состоянием, что упрощает управление состоянием рабочего пространства.