Сравнение систем памяти для агентов LLM: векторные, графовые и журналы событий

Оглавление Высокоуровневое сравнение 1. Векторные системы памяти 1.1 Простой векторный RAG 1.2 Иерархическая векторная память (MemGPT-стиль виртуального контекста)2. Графовые системы памяти 2.1 Временные графовые системы памяти (Zep / Graphiti) 2.2 Графовый RAG (GraphRAG)3. Системы журналов событий и выполнения 3.1 Журналы выполнения и контрольные точки (ALAS, LangGraph) 3.2 Эпизодическая долговременная память Ключевые выводы Надёжные мультиагентные системы … Читать далее

Знакомьтесь: Kosmos — учёный-ИИ, который автоматизирует открытия на основе данных

Kosmos, разработанный компанией Edison Scientific, — это автономная система открытий, которая проводит длительные исследовательские кампании с единой целью. Получив набор данных и задачу в открытом формате на естественном языке, он выполняет повторные циклы анализа данных, поиска в литературе и генерации гипотез, а затем объединяет результаты в полноценный научный отчёт со всеми ссылками. Архитектура, модель мира … Читать далее

Реализация кодирования для создания агентов с нейронной памятью, дифференцируемой памятью, метаобучением и воспроизведением опыта для непрерывной адаптации в динамических средах

В этом руководстве мы рассмотрим, как агенты с нейронной памятью могут непрерывно обучаться, не забывая прошлый опыт. Мы разрабатываем нейронную сеть с дополненной памятью, которая объединяет дифференцируемый нейронный компьютер (DNC) с воспроизведением опыта и метаобучением для быстрой адаптации к новым задачам при сохранении предыдущих знаний. Импорт библиотек и настройка конфигурации Мы начинаем с импорта всех … Читать далее

Серия интервью с AI #1: объяснение стратегий генерации текста в больших языковых моделях (LLMs)

Каждый раз, когда вы делаете запрос к LLM, модель не генерирует полный ответ сразу — она создаёт ответ по одному слову (или токену) за раз. На каждом шаге модель прогнозирует вероятность того, каким может быть следующий токен, основываясь на всём написанном до этого момента. Но одних только вероятностей недостаточно — модели нужна стратегия, чтобы решить, … Читать далее

StepFun AI выпускает Step-Audio-EditX: новую модель для редактирования аудио на уровне открытых исходников, превосходящую в выразительном и итеративном редактировании

Компания StepFun AI представила Step-Audio-EditX — модель для редактирования аудио, основанную на языковой модели с 3 миллиардами параметров. Она превращает редактирование выразительной речи в операцию, подобную работе с текстом на уровне токенов, вместо обработки сигналов на уровне волновых форм. Почему разработчикам важно контролируемое преобразование текста в речь (TTS)? Большинство систем TTS без дополнительных данных (zero … Читать далее

Как создать голосового помощника с агентским ИИ, который понимает, рассуждает, планирует и отвечает с помощью автономного многошагового интеллекта

В этом руководстве мы рассмотрим, как создать голосового помощника с агентским ИИ, способного понимать, рассуждать и отвечать с помощью естественной речи в режиме реального времени. Мы начнём с настройки автономного голосового интеллектуального конвейера, который объединяет распознавание речи, обнаружение намерений, многошаговое рассуждение и синтез текста в речь. Этапы создания 1. Настройка среды и библиотек: * Устанавливаем … Читать далее

Вложенное обучение: новый подход в машинном обучении для непрерывного обучения, рассматривающий модели как вложенные оптимизационные задачи для улучшения обработки длинных контекстов

Как создать системы искусственного интеллекта, которые будут постоянно обучаться новой информации, не забывая при этом ранее изученное и не требуя полной переподготовки? Исследователи из Google предложили вложенный подход к обучению (Nested Learning), который рассматривает модель как совокупность более мелких вложенных оптимизационных задач, а не как единую сеть, обучаемую одним внешним циклом. Цель — решить проблему … Читать далее

Prior Labs выпускает TabPFN-2.5: новейшую версию модели TabPFN, которая обеспечивает масштабируемость и скорость для табличных фундаментных моделей

Tabular data до сих пор является основой для многих важных моделей в производстве. Команды в области финансов, здравоохранения, энергетики и промышленности работают с таблицами из строк и столбцов, а не с изображениями или длинными текстами. Теперь Prior Labs расширяет это пространство с помощью TabPFN-2.5 — новой табличной фундаментной модели, которая масштабирует контекстное обучение до 50 … Читать далее

Создание продвинутого многостраничного веб-приложения с использованием Reflex

В этом руководстве мы создадим продвинутое веб-приложение на Reflex полностью на языке Python, которое будет без проблем работать внутри Colab. Приложение разработано для демонстрации того, как Reflex позволяет осуществлять разработку полного стека без JavaScript, используя только реактивный код Python. Мы создадим полноценную панель управления для управления заметками, которая будет включать в себя две страницы, взаимодействие … Читать далее

Google выпускает ADK Go: новый фреймворк с открытым исходным кодом для разработчиков на Go

Google выпустила Agent Development Kit для Go (ADK Go) — новый фреймворк с открытым исходным кодом, который позволяет разработчикам на Go создавать мощных агентов искусственного интеллекта (ИИ). Как создавать надёжных агентов ИИ, которые подключаются к существующим сервисам на Go без необходимости использования отдельного языкового стека? Раньше разработчикам приходилось использовать отдельный стек на Python для агентов. … Читать далее

Инициатива MIT в области энергетики запускает форум по энергоснабжению дата-центров

Глобальный спрос на электроэнергию для дата-центров, как ожидается, более чем удвоится к 2030 году. Инициатива MIT в области энергетики (MITEI) в сентябре инициировала проект, который объединяет исследователей MIT и экспертов отрасли для изучения инновационных решений по обеспечению энергией будущего, основанного на данных. На своей ежегодной исследовательской конференции MITEI объявила о создании форума по энергоснабжению дата-центров … Читать далее

Понимание инъекций промптов: вызов в области безопасности

Инъекции промптов — это вызов в области безопасности для систем искусственного интеллекта. Узнайте, как работают эти атаки, и как OpenAI продвигает исследования, обучает модели и создаёт защитные меры для пользователей. Основные моменты: Инъекции промптов представляют собой серьёзную угрозу для безопасности систем ИИ. OpenAI активно занимается исследованиями и разработкой защитных механизмов. Важно понимать механизмы таких атак … Читать далее

Редизайн Notion для агентского ИИ: как GPT-5 помог реализовать автономные рабочие процессы

Узнайте, как Notion перестроила свою архитектуру искусственного интеллекта с помощью GPT-5 для создания автономных агентов, которые могут рассуждать, действовать и адаптироваться в рабочих процессах. Узнайте, как этот переход обеспечил более высокую, быструю и гибкую продуктивность в Notion 3.0. #GPT-5 #автономныеагенты #рабочиепроцессы 1. Какие возможности GPT-5 были использованы для перестройки архитектуры искусственного интеллекта в Notion? Ответ: … Читать далее

Почему пространственное сверхчувственное восприятие становится ключевой способностью для мультимодальных систем искусственного интеллекта?

Даже мощные модели ИИ, работающие с длинным контекстом, плохо справляются с отслеживанием объектов и подсчётом их количества в длинных и запутанных видеопотоках. Поэтому следующее конкурентное преимущество получат модели, которые предсказывают, что будет дальше, и выборочно запоминают только удивительные, важные события, а не просто покупают больше вычислительных мощностей и увеличивают размер контекстных окон. Команда исследователей из … Читать далее

Сравнение шести сред выполнения для обслуживания больших языковых моделей в 2025 году

Большие языковые модели (LLM) сейчас ограничены не столько обучением, сколько скоростью и стоимостью обслуживания токенов при реальном трафике. Это зависит от трёх деталей реализации:* как среда выполнения обрабатывает запросы пакетами;* как она совмещает предварительное заполнение и декодирование;* как она хранит и повторно использует кэш KV. В статье сравниваются шесть сред выполнения, которые часто встречаются в … Читать далее

Создание мультиагентной системы для интерпретации данных транскриптомики, протеомики и метаболомики с учётом путей метаболизма

В этом руководстве мы создаём продвинутый мультиагентный конвейер, который интерпретирует интегрированные данные омиков, включая транскриптомику, протеомику и метаболомику, чтобы выявить ключевые биологические закономерности. Этапы работы 1. Генерация согласованных синтетических наборов данных, которые имитируют реалистичные биологические тенденции.2. Статистический анализ: агенты для статистического анализа, вывода сети, обогащения путей и перепрофилирования лекарств.3. Анализ сетей: определение главных регуляторов и … Читать далее

Обучение с подкреплением без обучения с временной разницей (RL without TD learning)

В этом посте я представлю алгоритм обучения с подкреплением (RL), основанный на «альтернативной» парадигме: «разделяй и властвуй». В отличие от традиционных методов, этот алгоритм не основан на обучении с временной разницей (TD learning), которое имеет проблемы с масштабируемостью, и хорошо масштабируется для задач с длинным горизонтом. Мы можем использовать RL на основе «разделяй и властвуй» … Читать далее

Moonshot AI выпускает модель мышления Kimi K2: впечатляющая модель, способная выполнять до 200–300 последовательных вызовов инструментов без вмешательства человека

Как спроектировать системы ИИ, которые могут планировать, рассуждать и действовать в течение длительных последовательностей решений без постоянного руководства человека? Компания Moonshot AI выпустила модель мышления Kimi K2 Thinking — модель-агент с открытым исходным кодом, которая демонстрирует полный поток рассуждений архитектуры Kimi K2 Mixture of Experts. Она предназначена для рабочих нагрузок, требующих глубокого анализа, длительного использования … Читать далее

Создание автономного планировщика и валидатора протоколов для влажной лаборатории с помощью Salesforce CodeGen для оптимизации проектирования экспериментов и обеспечения безопасности

В этом руководстве мы создаём планировщик и валидатор протоколов для влажной лаборатории, который действует как интеллектуальный агент для проектирования и проведения экспериментов. Мы разрабатываем систему на Python и интегрируем модель Salesforce CodeGen-350M-mono для рассуждений на естественном языке. Структура конвейера Мы структурируем конвейер на модульные компоненты:* ProtocolParser для извлечения структурированных данных, таких как шаги, продолжительность и … Читать далее

Google AI представляет DS STAR: мультиагентную систему для научных исследований данных, которая планирует, кодирует и проверяет аналитику от начала до конца

Google представила DS STAR (Data Science Agent via Iterative Planning and Verification) — мультиагентную систему, которая превращает открытые вопросы в области научных исследований данных в исполняемые скрипты на Python для работы с разнородными файлами. Вместо того чтобы полагаться на чистую базу данных SQL и один запрос, DS STAR решает задачу преобразования текста в Python и … Читать далее

На пути к будущему искусственного интеллекта: от более безопасных ответов к ускоренному мышлению

Внедрение новых инструментов и технологий происходит, когда пользователи в значительной степени воспринимают их как надёжные, доступные и более совершенные по сравнению с имеющимися методами и рабочими процессами при данной стоимости. Пять аспирантов из первого набора летней программы MIT-IBM Watson AI Lab используют современные ресурсы, устраняя болевые точки искусственного интеллекта (ИИ) и создавая новые функции и … Читать далее

От пилотного проекта к практике: как BBVA внедряет искусственный интеллект в работу организации

BBVA переосмысливает подход сотрудников к работе с ChatGPT Enterprise, интегрируя ИИ в повседневные операции. Банк сэкономил часы рабочего времени сотрудников в неделю, создал более 20 000 пользовательских версий GPT и добился повышения эффективности до 80%. 1. Какие конкретные результаты были достигнуты BBVA после внедрения ИИ в рабочие процессы? Ответ: BBVA сэкономил часы рабочего времени сотрудников … Читать далее

Исследователи MIT предложили новую модель понятного и модульного программного обеспечения

Использование больших языковых моделей (LLMs) в программировании открывает огромные перспективы, но также обнажает давние недостатки программного обеспечения: код, который является запутанным, сложным для безопасного изменения и часто непрозрачным в отношении того, что происходит под капотом. Исследователи из Лаборатории компьютерных наук и искусственного интеллекта MIT (CSAIL) намечают более «модульный» путь вперёд. Их новый подход разбивает системы … Читать далее

Исследователи из CMU представили PPP и UserVille для обучения проактивных и персонализированных агентов LLM

Большинство агентов LLM настроены на максимизацию успеха в выполнении задач. Они решают проблемы на GitHub или отвечают на сложные исследовательские запросы, но не всегда тщательно продумывают, когда задавать вопросы пользователю или как учитывать индивидуальные предпочтения в общении. Как разработать агентов LLM, которые будут знать, когда задавать более качественные вопросы и адаптировать своё поведение под каждого … Читать далее

Как CRED использует искусственный интеллект для обеспечения премиального качества обслуживания клиентов

CRED трансформирует взаимодействие с клиентами премиум-сегмента в Индии с помощью OpenAI. Используя инструменты на базе GPT, компания повышает точность поддержки, сокращает время отклика и увеличивает удовлетворённость клиентов. #CRED #ИИ #обслуживание_клиентов 1. Какие конкретные инструменты на базе GPT использует CRED для улучшения качества обслуживания клиентов? CRED использует инструменты на базе GPT от OpenAI для повышения точности … Читать далее

Generalist AI представляет GEN-θ: новый класс воплощённых фундаментальных моделей для мультимодального обучения на основе реальных физических взаимодействий

Как создать единую модель, которая сможет изучать физические навыки на основе хаотичных данных о работе роботов в реальном мире, не прибегая к симуляции? Компания Generalist AI представила GEN-θ — семейство воплощённых фундаментальных моделей, обученных непосредственно на данных о реальных физических взаимодействиях высокого качества, а не на интернет-видео или симуляциях. Система создана для установления законов масштабирования … Читать далее

Как Chime переопределяет маркетинг с помощью искусственного интеллекта

Винит Мехра, директор по маркетингу в Chime, рассказывает, как искусственный интеллект меняет маркетинг, превращая его в дисциплину, ориентированную на агентов. Он объясняет, почему директора по маркетингу, которые пропагандируют грамотность в области ИИ и его продуманное внедрение, станут лидерами в новую эпоху роста. #Как #Chime #маркетинг #ИИ 1. Какие изменения в маркетинге происходят благодаря искусственному интеллекту? … Читать далее

Как создать модель-агент, который учится внутреннему планированию, памяти и многоинструментальному мышлению с помощью сквозного обучения с подкреплением

В этом руководстве мы рассмотрим, как агент может усвоить планирование, память и использование инструментов в рамках единой нейронной модели, а не полагаться на внешнюю координацию. Мы разрабатываем компактного агента, который учится выполнять арифметические задачи с помощью обучения с подкреплением. Этапы разработки 1. Создание среды: мы создаём небольшой синтетический мир, где каждое действие, такое как умножение, … Читать далее

OpenAI представляет IndQA: бенчмарк, учитывающий культурные особенности индийских языков

Как можно достоверно проверить, понимают ли большие языковые модели индийские языки и культуру в реальных условиях? OpenAI выпустила IndQA — бенчмарк, который оценивает, насколько хорошо модели ИИ понимают вопросы и рассуждают о них на индийских языках в различных культурных областях. Зачем нужен IndQA? OpenAI заявляет, что около 80% людей в мире не говорят на английском … Читать далее

Более 1 миллиона бизнес-клиентов по всему миру уже используют OpenAI. В здравоохранении, медико-биологических науках, финансовых услугах и других сферах ChatGPT и наши API открывают новую эру интеллектуальной работы на базе искусственного интеллекта.

1 миллион компаний применяет ИИ в работе. 1. Какие сферы бизнеса уже используют технологии OpenAI? * В здравоохранении, медико-биологических науках, финансовых услугах и других сферах бизнес применяет ChatGPT и API от OpenAI. 2. Почему использование ИИ в бизнесе может быть интересным для потенциальных клиентов? * Более 1 миллиона бизнес-клиентов по всему миру уже используют OpenAI, … Читать далее