Разработчики активно работают над выводом на рынок агентов с искусственным интеллектом (ИИ), но серьёзным препятствием было отсутствие памяти. Без возможности вспомнить прошлые взаимодействия агенты обрабатывают каждый разговор так, как будто он первый, что приводит к повторным вопросам, неспособности запомнить предпочтения пользователя и общей обезличенности. Это вызывает разочарование как у пользователей, так и у разработчиков.
Решение проблемы с помощью Memory Bank
Чтобы преодолеть эти ограничения, Google Cloud анонсировала общедоступную предварительную версию Memory Bank — нового управляемого сервиса в составе Vertex AI Agent Engine. Memory Bank предназначен для создания высоко персонализированных диалоговых агентов, обеспечивающих более естественное, контекстуальное и непрерывное взаимодействие.
Например, в случае персонализированного агента в сфере здравоохранения ключевая информация об аллергии пользователя и предыдущих симптомах, упомянутая в прошлых сеансах, необходима для более информированного ответа в текущем сеансе.
Memory Bank решает фундаментальную проблему с памятью несколькими ключевыми способами:
* Персонализация взаимодействий. Memory Bank выходит за рамки стандартных скриптов, запоминая предпочтения пользователя, ключевые события и прошлые выборы, чтобы адаптировать каждый ответ.
* Поддержание непрерывности. Разговоры могут быть возобновлены с того места, где они были прерваны, даже после нескольких сеансов, которые могут длиться несколько дней или недель.
* Предоставление лучшего контекста. Агенты получают необходимую информацию о пользователе, что приводит к более релевантным, содержательным и полезным ответам.
* Улучшение пользовательского опыта. Memory Bank устраняет разочарование пользователей, вынужденных повторять информацию, создавая более естественные, эффективные и увлекательные диалоги.
Как работает Memory Bank
Memory Bank работает через интеллектуальный многоэтапный процесс, используя модели Google Gemini и новейшие исследования:
1. Понимание и извлечение воспоминаний. Memory Bank анализирует историю разговоров пользователя (хранящуюся в Agent Engine Sessions), чтобы извлечь ключевые факты, предпочтения и контекст. Этот процесс происходит асинхронно в фоновом режиме, генерируя новые воспоминания без необходимости для разработчиков создавать сложные конвейеры извлечения.
2. Хранение и обновление воспоминаний. Ключевая информация, такая как «Я предпочитаю солнечные дни», хранится и упорядочивается по определённому масштабу, например, по идентификатору пользователя. Когда появляется новая информация, Memory Bank, используя Gemini, может объединить её с существующими воспоминаниями, разрешая противоречия и обеспечивая актуальность воспоминаний.
3. Вызов соответствующей информации. Когда начинается новый сеанс разговора, агент может извлечь эти сохранённые воспоминания. Извлечение может быть простым вызовом всех фактов или более продвинутым поиском по сходству с использованием внедрений для поиска воспоминаний, наиболее релевантных текущей теме. Это гарантирует, что агент всегда будет оснащён правильным контекстом.
Этот процесс основан на новом методе исследования Google Research, принятом ACL 2025, который обеспечивает интеллектуальный, тематический подход к тому, как агенты обучаются и вспоминают информацию, устанавливая новый стандарт производительности памяти агентов.
Начало работы с Memory Bank
Memory Bank интегрирован с набором инструментов для разработки агентов (Agent Development Kit, ADK) и сеансами Agent Engine. Разработчики могут определить агента с помощью ADK и включить сеансы Agent Engine для управления историей разговоров в рамках отдельных сеансов. Затем можно включить Memory Bank для обеспечения долговременной памяти в нескольких сеансах.
Интегрировать Memory Bank в вашего агента можно двумя основными способами:
* Разработать агента с помощью Google Agent Development Kit (ADK) для готового решения.
* Разработать агента, который управляет вызовами API в Memory Bank, если вы создаёте своего агента с помощью любой другой платформы, включая популярные, такие как LangGraph и CrewAI.
Для тех, кто новичок в Google Cloud, но использует ADK, экспресс-режим регистрации для сеансов Agent Engine и Memory Bank позволяет зарегистрироваться с помощью учётной записи Gmail, чтобы получить ключ API и работать в рамках квот использования бесплатного уровня, прежде чем легко перейти к полноценному проекту Google Cloud для промышленного использования.
1. Какие проблемы в работе диалоговых агентов решает Memory Bank от Google Cloud?
Memory Bank решает несколько проблем в работе диалоговых агентов, таких как отсутствие памяти, повторные вопросы, неспособность запомнить предпочтения пользователя и обезличенность взаимодействий. Это обеспечивает более персонализированное, непрерывное и контекстуальное взаимодействие с пользователями.
2. Какие ключевые функции Memory Bank позволяют улучшить взаимодействие с пользователями?
Ключевые функции Memory Bank включают персонализацию взаимодействий, поддержание непрерывности разговоров, предоставление лучшего контекста для агентов и улучшение пользовательского опыта. Эти функции помогают агентам адаптироваться к предпочтениям пользователя, возобновлять разговоры с нужного места и предоставлять более релевантные и полезные ответы.
3. Какие модели и технологии используются в работе Memory Bank?
Memory Bank использует модели Google Gemini и новейшие исследования в области искусственного интеллекта. Он работает через интеллектуальный многоэтапный процесс, который включает понимание и извлечение воспоминаний, хранение и обновление воспоминаний, а также вызов соответствующей информации при начале нового сеанса разговора.
4. Какие преимущества даёт разработчикам интеграция Memory Bank в их агентов?
Интеграция Memory Bank в агентов позволяет разработчикам создавать более персонализированные и контекстуальные взаимодействия с пользователями. Разработчики могут определить агента с помощью Google Agent Development Kit (ADK) или разработать агента, который управляет вызовами API в Memory Bank. Это упрощает процесс разработки и позволяет быстро внедрить Memory Bank в существующие системы.
5. Какие шаги необходимо предпринять для начала работы с Memory Bank?
Для начала работы с Memory Bank разработчики могут определить агента с помощью Google Agent Development Kit (ADK), включить сеансы Agent Engine для управления историей разговоров и затем включить Memory Bank для обеспечения долговременной памяти в нескольких сеансах. Для новичков в Google Cloud экспресс-режим регистрации позволяет зарегистрироваться с помощью учётной записи Gmail, получить ключ API и работать в рамках квот использования бесплатного уровня.