OpenAI представляет новый универсальный ИИ-агент в ChatGPT, способный, по заявлению компании, выполнять широкий спектр компьютерных задач от имени пользователей. Агент умеет автоматически управлять календарём, создавать редактируемые презентации и слайд-шоу, а также запускать код.
Инструмент под названием ChatGPT Agent объединяет возможности предыдущих разработок OpenAI, включая функцию кликать по элементам веб-сайтов из инструмента Operator, а также способность синтезировать информацию из десятков источников в сжатые исследовательские отчёты, как это делает Deep Research. Пользователи смогут взаимодействовать с агентом через естественноязыковые запросы в ChatGPT.
С 3 октября ChatGPT Agent станет доступен подписчикам тарифов Pro, Plus и Team. Для активации нужно выбрать «режим агента» в выпадающем меню инструментов ChatGPT.
Запуск этого агента стал самой амбициозной попыткой OpenAI превратить ChatGPT в продукт, способный выполнять действия и делегировать задачи, а не просто отвечать на вопросы. За последние годы компании Кремниевой долины, включая OpenAI, Google и Perplexity, выпустили десятки ИИ-агентов с аналогичными обещаниями. Однако ранние версии таких систем демонстрировали сложности с выполнением комплексных задач, оказываясь менее эффективными, чем рисуют в своих презентациях технологические лидеры.
Тем не менее, в OpenAI заявляют, что ChatGPT Agent значительно превосходит предыдущие разработки. Новый агент поддерживает интеграцию с приложениями через ChatGPT Connectors, позволяя подключать сервисы вроде Gmail и GitHub для поиска информации, релевантной запросам. Кроме того, агент имеет доступ к терминалу и может использовать API для взаимодействия с определёнными приложениями.
Базовая модель ChatGPT Agent демонстрирует передовые показатели в различных тестах. Например, на сложном экзамене Humanity’s Last Exam (pass@1), состоящем из тысяч вопросов по сотням дисциплин, система набирает 41.6% — почти вдвое больше, чем предыдущие модели o3 и o4-mini. На одном из самых сложных математических бенчмарков FrontierMath агент показывает результат 27.4% при использовании инструментов вроде терминала для выполнения кода, тогда как o4-mini достигала лишь 6.3%.
OpenAI подчёркивает, что при разработке ChatGPT Agent особое внимание уделялось безопасности, поскольку новые возможности могут повысить риски злонамеренного использования. Однако реальная эффективность агента ещё требует практической проверки.