NVIDIA представляет Universal Deep Research (UDR): прототип фреймворка для масштабируемых и поддающихся аудиту агентов глубоких исследований

Почему существующие инструменты для глубоких исследований не соответствуют ожиданиям?

Инструменты для глубоких исследований (DRT) вроде Gemini Deep Research, Perplexity, Deep Research от OpenAI и Grok DeepSearch используют жёсткие рабочие процессы, привязанные к фиксированной LLM. Хотя они эффективны, они накладывают строгие ограничения: пользователи не могут определять пользовательские стратегии, менять модели или применять протоколы, специфичные для предметной области.

Анализ NVIDIA выделяет три основные проблемы:
* Пользователи не могут устанавливать предпочтительные источники, правила проверки или контроль затрат.
* Специализированные исследовательские стратегии для таких областей, как финансы, право или здравоохранение, не поддерживаются.
* DRT привязаны к одиночным моделям, что препятствует гибкому сочетанию лучшей LLM с лучшей стратегией.

Эти проблемы ограничивают внедрение в высокоценных корпоративных и научных приложениях.

Что такое Universal Deep Research (UDR)?

Universal Deep Research (UDR) — это система с открытым исходным кодом (в предварительной версии), которая отделяет стратегию от модели. Она позволяет пользователям разрабатывать, редактировать и запускать собственные рабочие процессы глубоких исследований без необходимости переобучения или точной настройки какой-либо LLM.

В отличие от существующих инструментов, UDR работает на уровне оркестровки системы:
* Преобразует пользовательские исследовательские стратегии в исполняемый код.
* Запускает рабочие процессы в изолированной среде для обеспечения безопасности.
* Рассматривает LLM как утилиту для локального анализа (резюмирование, ранжирование, извлечение) вместо предоставления ей полного контроля.

Эта архитектура делает UDR лёгким, гибким и независимым от модели.

Как UDR обрабатывает и выполняет исследовательские стратегии?

UDR принимает два входных параметра: исследовательскую стратегию (пошаговый рабочий процесс) и исследовательский запрос (тема и требования к результату).

Обработка стратегии

Стратегии на естественном языке компилируются в код Python со строгой структурой. Переменные хранят промежуточные результаты, избегая переполнения контекстного окна. Все функции детерминированы и прозрачны.

Выполнение стратегии

Логика управления выполняется на CPU; только задачи рассуждения вызывают LLM. Уведомления выдаются через операторы yield, информируя пользователей в режиме реального времени. Отчёты собираются из состояний сохранённых переменных, обеспечивая отслеживаемость.

Такое разделение оркестровки и рассуждения повышает эффективность и снижает затраты на GPU.

Какие примеры стратегий доступны?

NVIDIA поставляет UDR с тремя шаблонными стратегиями:
* Минимальная — сгенерировать несколько поисковых запросов, собрать результаты и составить краткий отчёт.
* Расширенная — исследовать несколько тем параллельно для более широкого охвата.
* Интенсивная — итеративное уточнение запросов с использованием развивающихся подконтекстов, идеально подходит для глубоких погружений.

Они служат отправной точкой, но фреймворк позволяет пользователям кодировать полностью собственные рабочие процессы.

Какие выходные данные генерирует UDR?

UDR выдаёт два ключевых выходных данных:
* Структурированные уведомления — обновления о ходе работы (с типом, отметкой времени и описанием) для обеспечения прозрачности.
* Итоговый отчёт — документ исследования в формате Markdown, дополненный разделами, таблицами и ссылками.

Такая структура даёт пользователям возможность аудита и воспроизводимости, в отличие от непрозрачных агентских систем.

Где можно применить UDR?

Общий дизайн UDR делает его адаптируемым к различным областям:
* Научные открытия: структурированные обзоры литературы.
* Корпоративная комплексная проверка: проверка соответствия заявкам и наборам данных.
* Бизнес-аналитика: конвейеры анализа рынка.
* Стартапы: создание пользовательских помощников без переобучения LLM.

Разделяя выбор модели и логику исследования, UDR поддерживает инновации в обоих направлениях.

Резюме

Universal Deep Research сигнализирует о переходе от ориентированных на модели к ориентированным на систему агентам искусственного интеллекта. Предоставляя пользователям прямой контроль над рабочими процессами, NVIDIA создаёт настраиваемые, эффективные и поддающиеся аудиту исследовательские системы.

Для стартапов и предприятий UDR предоставляет основу для создания специализированных помощников без затрат на переобучение модели, открывая новые возможности для инноваций в различных отраслях.

Ознакомиться с документом можно по ссылкам: [PAPER](), [PROJECT](), [CODE]().

Подписывайтесь на нашу [GitHub Page](https://github.com) для ознакомления с учебными материалами, кодами и ноутбуками. Также подписывайтесь на нас в [Twitter](https://twitter.com) и присоединяйтесь к нашему [ML SubReddit](https://www.reddit.com/r/MachineLearning/) с более чем 100 тысячами участников и подписывайтесь на нашу [рассылку](https://www.marktechpost.com/newsletter).

1. Какие проблемы существующих инструментов для глубоких исследований решает UDR?

Ответ: существующие инструменты для глубоких исследований, такие как Gemini Deep Research, Perplexity, Deep Research от OpenAI и Grok DeepSearch, используют жёсткие рабочие процессы, привязанные к фиксированной LLM. Они эффективны, но накладывают строгие ограничения: пользователи не могут определять пользовательские стратегии, менять модели или применять протоколы, специфичные для предметной области. UDR решает эти проблемы, позволяя пользователям разрабатывать, редактировать и запускать собственные рабочие процессы глубоких исследований без необходимости переобучения или точной настройки какой-либо LLM.

2. Какие ключевые выходные данные генерирует UDR?

Ответ: UDR выдаёт два ключевых выходных данных: структурированные уведомления — обновления о ходе работы (с типом, отметкой времени и описанием) для обеспечения прозрачности; итоговый отчёт — документ исследования в формате Markdown, дополненный разделами, таблицами и ссылками.

3. Какие примеры шаблонных стратегий предоставляет NVIDIA вместе с UDR?

Ответ: NVIDIA поставляет UDR с тремя шаблонными стратегиями: минимальная — сгенерировать несколько поисковых запросов, собрать результаты и составить краткий отчёт; расширенная — исследовать несколько тем параллельно для более широкого охвата; интенсивная — итеративное уточнение запросов с использованием развивающихся подконтекстов, идеально подходит для глубоких погружений. Они служат отправной точкой, но фреймворк позволяет пользователям кодировать полностью собственные рабочие процессы.

4. В каких областях можно применить UDR?

Ответ: общий дизайн UDR делает его адаптируемым к различным областям: научные открытия (структурированные обзоры литературы), корпоративная комплексная проверка (проверка соответствия заявкам и наборам данных), бизнес-аналитика (конвейеры анализа рынка), стартапы (создание пользовательских помощников без переобучения LLM).

5. Почему UDR является значимым шагом в развитии агентов искусственного интеллекта?

Ответ: UDR является значимым шагом в развитии агентов искусственного интеллекта, поскольку сигнализирует о переходе от ориентированных на модели к ориентированным на систему агентам. Предоставляя пользователям прямой контроль над рабочими процессами, NVIDIA создаёт настраиваемые, эффективные и поддающиеся аудиту исследовательские системы. Это открывает новые возможности для инноваций в различных отраслях.

Источник