Как агент ИИ выбирает, что делать при ограничениях на токены, задержку и бюджет инструментальных вызовов?

В этом руководстве мы создаём агента планирования, учитывающего затраты, который осознанно балансирует качество выходных данных с реальными ограничениями, такими как использование токенов, задержка и бюджет инструментальных вызовов. Агент генерирует несколько вариантов действий, оценивает их ожидаемые затраты и выгоды, а затем выбирает план выполнения, который максимизирует ценность, оставаясь в рамках строгих бюджетов.

Этапы создания агента

1. Настройка среды выполнения: мы устанавливаем среду выполнения и безопасно загружаем ключ API OpenAI во время выполнения без его жёсткого кодирования. Также мы инициализируем клиента, чтобы агент мог перейти в автономный режим, если API недоступен.

2. Определение основных абстракций бюджетирования: мы моделируем использование токенов, задержку и инструментальные вызовы как первоклассные величины и предоставляем служебные методы для накопления и проверки расходов.

3. Создание структур данных: мы вводим структуры данных, которые представляют отдельные варианты действий и полные кандидаты в планы. Мы также определяем облегчённую оболочку LLM, которая стандартизирует генерацию и измерение текста.

Генерация вариантов шагов

Мы фокусируемся на генерации разнообразного набора вариантов шагов, включая как основанные на LLM, так и локальные альтернативы с различными компромиссами между затратами и качеством. Мы также используем саму модель, чтобы предложить дополнительные низкозатратные улучшения, контролируя их влияние на бюджет.

Планирование в рамках бюджета

Мы реализуем логику планирования с учётом бюджета, которая ищет комбинацию шагов с наивысшей стоимостью в рамках строгих ограничений. Мы применяем поиск в стиле луча с штрафами за избыточность, чтобы избежать ненужных перекрытий действий.

Выполнение плана

Мы выполняем выбранный план и отслеживаем фактическое использование ресурсов шаг за шагом. Мы динамически выбираем между локальными путями выполнения и путями выполнения с помощью LLM и объединяем окончательный результат в связный черновик.

В заключение мы продемонстрировали, как агент планирования, учитывающий затраты, может рассуждать о своём потреблении ресурсов и адаптировать своё поведение в реальном времени. Мы выполнили только те шаги, которые соответствовали заранее определённым бюджетам, и отследили фактические расходы, чтобы проверить предположения о планировании.

Также мы подчеркнули, как агентские системы ИИ могут стать более практичными, управляемыми и масштабируемыми, рассматривая затраты, задержку и использование инструментов как первоклассные переменные решения, а не как второстепенные факторы.

1. Какие основные этапы включает в себя создание агента планирования, учитывающего затраты?

Ответ: создание агента планирования включает в себя несколько этапов: настройка среды выполнения, определение основных абстракций бюджетирования, создание структур данных, генерация вариантов шагов, планирование в рамках бюджета и выполнение плана.

2. Как агент балансирует качество выходных данных с ограничениями на токены, задержку и бюджет инструментальных вызовов?

Ответ: агент генерирует несколько вариантов действий, оценивает их ожидаемые затраты и выгоды, а затем выбирает план выполнения, который максимизирует ценность, оставаясь в рамках строгих бюджетов. Это позволяет балансировать качество выходных данных с учётом ограничений.

3. Какие методы используются для накопления и проверки расходов в рамках бюджета инструментальных вызовов?

Ответ: в статье не приводятся конкретные методы, но упоминается, что используются служебные методы для накопления и проверки расходов. Это позволяет моделировать использование токенов, задержку и инструментальные вызовы как первоклассные величины и контролировать расходы в рамках бюджета.

4. Какие структуры данных используются для представления вариантов действий и планов?

Ответ: для представления вариантов действий и планов используются структуры данных, которые стандартизируют генерацию и измерение текста. Это позволяет эффективно управлять вариантами действий и выбирать оптимальные планы выполнения.

5. Какие альтернативные пути выполнения действий рассматриваются при планировании в рамках бюджета?

Ответ: при планировании в рамках бюджета рассматриваются как основанные на LLM, так и локальные альтернативы с различными компромиссами между затратами и качеством. Это позволяет выбирать наиболее эффективные пути выполнения действий в зависимости от доступных ресурсов.

Источник