OpenAI представляет ChatGPT Agent: от исследований до автоматизации в реальном мире

17 июля 2025 года компания OpenAI выпустила ChatGPT Agent, преобразовав ChatGPT из разговорного помощника в унифицированного ИИ-агента, способного автономно выполнять сложные многоэтапные задачи — от просмотра веб-страниц до выполнения кода — в виртуальной компьютерной среде.

Предыдущие возможности и их объединение

ChatGPT Agent основан на двух предыдущих инструментах:
* Operator предоставлял ограниченные возможности взаимодействия с веб-сайтами — клики, прокрутку и заполнение форм — с помощью агента на основе браузера.
* Deep Research обеспечивал автономный просмотр и синтез отчётов в течение более длительных периодов времени.

По отдельности у них были ограничения: Operator мог взаимодействовать, но не мог выполнять глубокий анализ; Deep Research мог анализировать, но не мог динамически взаимодействовать с сайтами. ChatGPT Agent объединяет сильные стороны обоих инструментов, объединяя просмотр, использование инструментов и рассуждения в рамках единой агентской архитектуры.

Внутренняя архитектура и рабочий процесс

В основе лежит виртуальная компьютерная среда, объединяющая:
* визуальный браузер для сайтов, ориентированных на человека;
* текстовый браузер, оптимизированный для структурированных рассуждений;
* оболочку/терминал для выполнения кода;
* интегрированные API-коннекторы для таких сервисов, как Gmail или GitHub.

Агент постоянно адаптируется — решает, нажимать ли кнопки, запускать скрипты или анализировать контент — при этом сохраняя состояние инструментов. Все действия происходят в контролируемом контексте агента, что обеспечивает отслеживаемость и гибкость.

Примеры задач: от планирования до выполнения

ChatGPT Agent может решать такие задачи, как:
* Календарь-брифинг: просмотр календаря, поиск связанных новостей и составление сводки предстоящих встреч.
* Заказ продуктов: поиск ингредиентов, сравнение цен, размещение заказов.
* Конкурентный анализ: поиск страниц конкурентов, сбор данных, создание слайдов или таблиц.
* Финансовое моделирование: загрузка данных, обновление таблиц, сохранение форматирования.

Эти рабочие процессы включают в себя использование мультимодальных инструментов: вход на сайты, запуск скриптов в терминале, затем упаковка результатов в редактируемые документы — всё это под вашим контролем.

Производительность: тесты и сравнения с человеком

OpenAI сообщает о значительных улучшениях по ряду тестов:
* Humanity’s Last Exam: Pass@1 — 41,6 % (лучший агентский результат); до 44,4 % при параллельных испытаниях.
* FrontierMath: 27,4 % точности при использовании терминала и поддержки кода, что превосходит предыдущие модели.
* SpreadsheetBench: 45,5 % общего балла при редактировании XLSX по сравнению с Copilot в Excel (20 %) и человеческими показателями ≈71 %.
* Внутренний бенчмарк для интеллектуального труда: инструменты агента соответствуют или превосходят экспертные показатели примерно в 50 % случаев.
* BrowseComp & WebArena: новые современные результаты с 68,9 % по задачам, основанным на просмотре.

Эти оценки демонстрируют заметное улучшение как автономности, так и сложности задач.

Безопасность и снижение рисков

Автономность агентов влечёт за собой новые риски. OpenAI внедрила несколько мер безопасности:
* Явное подтверждение перед любыми значимыми действиями (например, покупками, публикацией).
* Режим наблюдения: некоторые чувствительные задачи требуют активного контроля.
* Надёжная защита от внедрения запросов, включая обучение для обнаружения аномальных веб-запросов и мониторинг выходных данных инструментов.
* Механизмы конфиденциальности: режим захвата сеанса с сохранением конфиденциальности, без сохранения конфиденциальных входных данных, таких как пароли.
* Меры по борьбе с биологическими угрозами: классифицированы как высокорисковые для биологических агентов, что запускает расширенное моделирование угроз, обучение отказу, мониторинг в реальном времени и системы вознаграждений за обнаружение ошибок.

Эти уровни направлены на снижение злоупотреблений — от утечек данных до захвата задач.

Как начать работу

Доступно сейчас для пользователей ChatGPT Pro, Plus и Team:
* Пользователи Pro получают доступ сегодня с 400 сообщениями в агентском режиме в месяц.
* Пользователи Plus и Team получат постепенный доступ в ближайшие дни (40 сообщений в месяц).
* Корпоративные и образовательные уровни появятся в ближайшие недели.
* Запуск в других странах (ЕЭЗ, Швейцария) уже идёт.

Вы можете переключиться в «Режим агента» через меню инструментов в любом разговоре и описать желаемый рабочий процесс. Ход выполнения озвучивается в режиме реального времени, и вы можете приостановить, взять на себя управление или остановить его в любой момент.

Значение для рабочих процессов с использованием ИИ

ChatGPT Agent представляет собой переход от пассивных систем с ответами на запросы к проактивным цифровым работникам. Объединяя:
* языковое рассуждение (через модели класса GPT-4);
* координацию инструментов (браузеры, терминалы);
* контекстно-сохраняющие среды выполнения,

OpenAI создаёт более автономные, надёжные и ориентированные на действия варианты использования. Хотя контроль необходим для предотвращения злоупотреблений, этот выпуск расширяет возможности того, что могут делать ИИ-помощники, а не только говорить.

Для разработчиков и специалистов по работе с данными ChatGPT Agent становится платформой: программируемым, наблюдаемым агентом, способным выполнять очистку, синтаксический анализ, синтез и экспорт по запросу. Это открывает возможности для рабочих процессов нового поколения в исследованиях, бизнес-автоматизации и повышении личной производительности.

Заключение

ChatGPT Agent — это не просто улучшение разговорного взаимодействия, это стратегический поворот к обобщённым автономным рабочим процессам с использованием ИИ. Его дебют знаменует переход от пассивных советников к активным агентам, выполняющим исследования, создание и действия в реальном мире в единой контролируемой среде. Ожидайте, что это станет основополагающей возможностью во всех областях, где используются ИИ-помощники.

Возможность спонсорства

Охватите самых влиятельных разработчиков в области ИИ по всему миру. 1 миллион+ читателей в месяц, 500 тысяч+ создателей сообществ, бесконечные возможности. [Изучить спонсорство]

1. Какие новые возможности предоставляет ChatGPT Agent по сравнению с предыдущими инструментами OpenAI?

ChatGPT Agent объединяет возможности двух предыдущих инструментов: Operator и Deep Research. Оператор предоставлял ограниченные возможности взаимодействия с веб-сайтами, а Deep Research обеспечивал автономный просмотр и синтез отчётов. ChatGPT Agent объединяет сильные стороны обоих инструментов, объединяя просмотр, использование инструментов и рассуждения в рамках единой агентской архитектуры.

2. Какие задачи может решать ChatGPT Agent?

ChatGPT Agent может решать такие задачи, как:
* календарь-брифинг: просмотр календаря, поиск связанных новостей и составление сводки предстоящих встреч;
* заказ продуктов: поиск ингредиентов, сравнение цен, размещение заказов;
* конкурентный анализ: поиск страниц конкурентов, сбор данных, создание слайдов или таблиц;
* финансовое моделирование: загрузка данных, обновление таблиц, сохранение форматирования.

3. Какие меры безопасности внедрила OpenAI для предотвращения злоупотреблений при использовании ChatGPT Agent?

OpenAI внедрила несколько мер безопасности:
* явное подтверждение перед любыми значимыми действиями (например, покупками, публикацией);
* режим наблюдения: некоторые чувствительные задачи требуют активного контроля;
* надёжная защита от внедрения запросов, включая обучение для обнаружения аномальных веб-запросов и мониторинг выходных данных инструментов;
* механизмы конфиденциальности: режим захвата сеанса с сохранением конфиденциальности, без сохранения конфиденциальных входных данных, таких как пароли;
* меры по борьбе с биологическими угрозами: классифицированы как высокорисковые для биологических агентов, что запускает расширенное моделирование угроз, обучение отказу, мониторинг в реальном времени и системы вознаграждений за обнаружение ошибок.

4. Какие уровни доступа к ChatGPT Agent доступны для пользователей?

Пользователи ChatGPT Pro получают доступ сегодня с 400 сообщениями в агентском режиме в месяц. Пользователи Plus и Team получат постепенный доступ в ближайшие дни (40 сообщений в месяц). Корпоративные и образовательные уровни появятся в ближайшие недели. Запуск в других странах (ЕЭЗ, Швейцария) уже идёт.

5. В чём заключается стратегическое значение выпуска ChatGPT Agent для рабочих процессов с использованием ИИ?

ChatGPT Agent представляет собой переход от пассивных систем с ответами на запросы к проактивным цифровым работникам. Объединяя языковое рассуждение, координацию инструментов и контекстно-сохраняющие среды выполнения, OpenAI создаёт более автономные, надёжные и ориентированные на действия варианты использования. Это открывает возможности для рабочих процессов нового поколения в исследованиях, бизнес-автоматизации и повышении личной производительности.

Источник