В современном мире искусственного интеллекта мы привыкли к «эфемерным агентам» — блестящим, но забывчивым помощникам, которые перезагружают свои когнитивные часы с каждым новым сеансом чата. Хотя большие языковые модели стали отличными кодировщиками, им не хватает устойчивого состояния, необходимого для того, чтобы функционировать как настоящие партнёры.
Команда Nous Research выпустила «Агента Гермес» — автономную систему с открытым исходным кодом, разработанную для решения двух основных проблем в агентских рабочих процессах: затухания памяти и изоляции от среды.
Иерархия памяти: обучение через документы навыков
Чтобы агент мог «расти», ему нужно больше, чем просто большое контекстное окно. «Агент Гермес» использует многоуровневую систему памяти, которая имитирует процедурное обучение. Хотя он справляется с краткосрочными задачами посредством стандартного вывода, его долгосрочная полезность обеспечивается документами навыков.
Когда «Агент Гермес» выполняет сложную задачу — например, отладку конкретного микросервиса или оптимизацию конвейера данных — он может преобразовать этот опыт в постоянную запись. Эти записи хранятся в виде файлов Markdown, доступных для поиска, в соответствии с открытым стандартом agentskills.io.
Процедурная память: в следующий раз, когда вы попросите агента выполнить аналогичную задачу, он не начнёт с нуля. Он запросит свою библиотеку документов навыков, чтобы «вспомнить» успешные шаги, которые предпринимал ранее.
Контекстуальная устойчивость: в отличие от стандартного RAG (Retrieval-Augmented Generation), который часто выдаёт несвязанные фрагменты, эта система позволяет агенту поддерживать связное понимание вашей конкретной кодовой базы и предпочтений в течение недель или месяцев.
Постоянный доступ к машинам: за пределами песочницы
Основным препятствием для разработчиков ИИ является «разрыв в исполнении». Большинство агентов пишут код, но не могут взаимодействовать с реальным миром без серьёзного ручного вмешательства. «Агент Гермес» устраняет этот разрыв, предоставляя постоянный выделенный доступ к машинам.
Агент предназначен для работы в функциональной среде, поддерживая пять различных бэкендов:
* Локальный: прямое взаимодействие с хост-машиной.
* Docker: изолированные воспроизводимые контейнеры для безопасного выполнения кода.
* SSH: возможность входа на удалённые серверы или облачные инстансы.
* Singularity: поддержка высокопроизводительных вычислений (HPC) в контейнерах.
* Modal: бессерверное выполнение для масштабирования тяжёлых рабочих нагрузок.
Этот постоянный доступ имеет решающее значение для разработчиков ИИ. Вы можете инициализировать долгосрочный EDA (Exploratory Data Analysis) на удалённом сервере через SSH, выйти из системы и вернуться позже. Агент поддерживает состояние терминала, управляет фоновыми процессами и независимо отслеживает изменения файловой системы. Он не просто имитирует разговор; он управляет рабочим пространством.
Герметичные ворота: агент в вашем кармане
Хотя большинство технических агентов ограничены интерфейсом командной строки или проприетарной веб-панелью, Nous Research уделяет приоритетное внимание доступности через «Герметичные ворота».
Система интегрируется напрямую с существующими коммуникационными стеками, включая Telegram, Discord, Slack и WhatsApp. Это позволяет обеспечить непрерывную обратную связь: инженер может начать задачу на своём рабочем месте и получить уведомление о «выполнении задачи» через Telegram. Через шлюз вы можете отправлять последующие инструкции или даже голосовые заметки, которые агент обрабатывает и выполняет в своей постоянной среде.
Под капотом: цикл ReAct и управляемость
Для разработчиков ИИ, работающих над этим, архитектура представляет собой усовершенствованную реализацию цикла ReAct (Reasoning and Acting). Агент следует структурированному циклу:
1. Наблюдение: чтение вывода терминала или содержимого файла.
2. Рассуждение: анализ текущего состояния по отношению к цели.
3. Действие: выполнение команды или вызов инструмента.
Это реализовано на основе модели Hermes-3 (на базе Llama 3.1), которая была обучена с использованием специализированной структуры обучения с подкреплением под названием Atropos. Это обучение специально нацелено на точность вызова инструментов и долгосрочное планирование, гарантируя, что агент не «теряется» во время многошаговых развёртываний.
Ключевые выводы
* Постоянный доступ к машинам: в отличие от чат-ботов без состояния, он работает в реальных терминальных средах (Docker, SSH, Local и т. д.), что позволяет ему выполнять долгосрочные задачи и поддерживать состояние файлов между сеансами.
* Самоэволюционирующиеся «документы навыков»: он использует многоуровневую систему памяти для записи успешных рабочих процессов в виде файлов Markdown (через agentskills.io), что означает, что он буквально становится умнее, чем больше вы его используете.
* Прецизионное мышление «Hermes-3»: на базе модели Hermes-3, созданной на основе Llama 3.1, он настроен с помощью Atropos RL для обеспечения высокой управляемости и надёжного вызова инструментов в рамках сложных логических циклов.
* Вездесущие ворота: вы можете взаимодействовать со своим агентом через Telegram, Discord или Slack, что позволяет вам управлять сложными инженерными задачами или получать обновления статуса с вашего телефона.
Ознакомьтесь с техническими деталями и репозиторием GitHub. Подписывайтесь на нас в Twitter и присоединяйтесь к нашему сообществу в SubReddit (более 120 тысяч участников машинного обучения) и подписывайтесь на нашу рассылку. А если вы ещё не в Telegram, присоединяйтесь и к нам туда!
1. Какие основные проблемы в агентских рабочих процессах решает «Агент Гермес» от Nous Research?
Ответ: «Агент Гермес» решает две основные проблемы: затухание памяти и изоляцию от среды. Он использует многоуровневую систему памяти, которая имитирует процедурное обучение, и обеспечивает постоянный доступ к машинам для выполнения задач.
2. Как «Агент Гермес» обеспечивает контекстуальную устойчивость при выполнении задач?
Ответ: «Агент Гермес» обеспечивает контекстуальную устойчивость за счёт использования документов навыков, которые хранятся в виде файлов Markdown. Эти документы содержат записи о предыдущих успешных шагах, которые агент может использовать при выполнении аналогичных задач. Это позволяет агенту поддерживать связное понимание кодовой базы и предпочтений пользователя в течение длительного времени.
3. Какие бэкенды поддерживает «Агент Гермес» для взаимодействия с реальным миром?
Ответ: «Агент Гермес» поддерживает пять различных бэкендов: локальный (прямое взаимодействие с хост-машиной), Docker (изолированные воспроизводимые контейнеры для безопасного выполнения кода), SSH (возможность входа на удалённые серверы или облачные инстансы), Singularity (поддержка высокопроизводительных вычислений в контейнерах) и Modal (бессерверное выполнение для масштабирования тяжёлых рабочих нагрузок).
4. Как система «Герметичные ворота» обеспечивает доступность «Агента Гермес»?
Ответ: система «Герметичные ворота» интегрируется напрямую с существующими коммуникационными стеками, включая Telegram, Discord, Slack и WhatsApp. Это позволяет обеспечить непрерывную обратную связь: инженер может начать задачу на своём рабочем месте и получить уведомление о «выполнении задачи» через Telegram. Через шлюз можно отправлять последующие инструкции или даже голосовые заметки, которые агент обрабатывает и выполняет в своей постоянной среде.
5. На какой архитектуре основана модель «Агента Гермес» и как она обеспечивает управляемость и точность?
Ответ: модель «Агента Гермес» основана на архитектуре Hermes-3 (на базе Llama 3.1), которая была обучена с использованием специализированной структуры обучения с подкреплением под названием Atropos. Это обучение специально нацелено на точность вызова инструментов и долгосрочное планирование, гарантируя, что агент не «теряется» во время многошаговых развёртываний.