OpenAI запускает универсальный агент в ChatGPT

OpenAI представляет новый универсальный ИИ-агент в ChatGPT, способный, по заявлению компании, выполнять широкий спектр компьютерных задач от имени пользователей. Агент умеет автоматически управлять календарём, создавать редактируемые презентации и слайд-шоу, а также запускать код.

Инструмент под названием ChatGPT Agent объединяет возможности предыдущих разработок OpenAI, включая функцию кликать по элементам веб-сайтов из инструмента Operator, а также способность синтезировать информацию из десятков источников в сжатые исследовательские отчёты, как это делает Deep Research. Пользователи смогут взаимодействовать с агентом через естественноязыковые запросы в ChatGPT.

С 3 октября ChatGPT Agent станет доступен подписчикам тарифов Pro, Plus и Team. Для активации нужно выбрать «режим агента» в выпадающем меню инструментов ChatGPT.

Запуск этого агента стал самой амбициозной попыткой OpenAI превратить ChatGPT в продукт, способный выполнять действия и делегировать задачи, а не просто отвечать на вопросы. За последние годы компании Кремниевой долины, включая OpenAI, Google и Perplexity, выпустили десятки ИИ-агентов с аналогичными обещаниями. Однако ранние версии таких систем демонстрировали сложности с выполнением комплексных задач, оказываясь менее эффективными, чем рисуют в своих презентациях технологические лидеры.

Тем не менее, в OpenAI заявляют, что ChatGPT Agent значительно превосходит предыдущие разработки. Новый агент поддерживает интеграцию с приложениями через ChatGPT Connectors, позволяя подключать сервисы вроде Gmail и GitHub для поиска информации, релевантной запросам. Кроме того, агент имеет доступ к терминалу и может использовать API для взаимодействия с определёнными приложениями.

Базовая модель ChatGPT Agent демонстрирует передовые показатели в различных тестах. Например, на сложном экзамене Humanity’s Last Exam (pass@1), состоящем из тысяч вопросов по сотням дисциплин, система набирает 41.6% — почти вдвое больше, чем предыдущие модели o3 и o4-mini. На одном из самых сложных математических бенчмарков FrontierMath агент показывает результат 27.4% при использовании инструментов вроде терминала для выполнения кода, тогда как o4-mini достигала лишь 6.3%.

OpenAI подчёркивает, что при разработке ChatGPT Agent особое внимание уделялось безопасности, поскольку новые возможности могут повысить риски злонамеренного использования. Однако реальная эффективность агента ещё требует практической проверки.

Оставьте комментарий Отменить ответ