Если проект «Claude Plays Pokémon» должен дать представление о будущем искусственного интеллекта, то это не очень убедительная демонстрация. Уже больше месяца Twitch наблюдает, как чат-бот компании Anthropic пытается пройти игру Pokémon Red, но пока безуспешно. И всё же для Дэвида Хершея, ведущего разработчика проекта, эта демонстрация оказалась успешной.
«Я хотел найти место, где можно было бы понять, как Claude справляется с ситуациями, требующими длительной работы», — объясняет Хершей в видеозвонке. В своей повседневной работе в Anthropic Хершей занимается маркетингом и помогает клиентам компании создавать собственных агентов (подробнее об этом чуть позже). Он начал работать над проектом «Claude Plays Pokémon» как над побочным примерно в то время, когда Anthropic выпустила модель 3.5 Sonnet в июне прошлого года.
Как можно догадаться по названию, проект частично вдохновлён «Twitch Plays Pokémon», который дебютировал в 2014 году и собрал 1,16 миллиона участников, пытающихся пройти Pokémon Red, используя только команды, которые зрители вводили в чат. Хершей был не первым сотрудником Anthropic, кто попытался превратить Claude в чемпиона Лиги покемонов, но проект обрёл собственную жизнь примерно в то время, когда он подключился к нему.
В первые дни проекта было большим событием, когда Claude удалось покинуть дом Реда и найти профессора Оука. «Я потратил немыслимое количество часов, пытаясь добиться такого прогресса», — рассказывает Хершей. Он сообщал своим коллегам о достижениях Claude в внутреннем канале Slack. В тот момент большая часть компании не обращала на это внимания, и Anthropic не планировала делиться этим с миром.
Тем не менее Хершей взял за правило пересматривать проект с каждым новым крупным выпуском модели от Anthropic, начиная с обновлённой версии Claude 3.5 Sonnet прошлой осенью и недавно с 3.7 Sonnet. «Это мой способ узнать: „Что это за новая модель?“, „Как она работает?“, „Чему я могу научиться у неё?“» — объясняет Хершей. И с Claude 3.7 Sonnet, текущей версией, играющей в игру, впервые «можно было прищуриться и увидеть признаки жизни».
Внутри Anthropic надеялись, что Claude станет лучше в пробах различных стратегий и корректировке своего подхода, когда что-то идёт не по плану. С Pokémon Red компания увидела, как Claude делает это в реальном времени. «[Claude 3.7 Sonnet] меньше времени тратит на предположения», — говорит Хершей. «Вы всё ещё увидите, как он делает предположение, а затем какое-то время верит в его истинность и принимает глупые решения, но предыдущие модели продолжали бы делать это вечно».
И вы можете буквально увидеть, как Claude разрабатывает предположения и работает с ними. Каждому медленному ходу в игре предшествует абзац текстового вывода от ИИ — «Я столкнулся с диким Зубатом, пытаясь добраться до (24,24). Согласно моей стратегии, я должен бежать из этой битвы, чтобы сохранить ресурсы», — а затем одно нажатие кнопки. Затем он заново оценивает состояние игры и делает всё заново.
Если вы наблюдали за тем, как Claude проходит Pokémon Red, будучи фанатом игры, модель, которая тратит «меньше времени на предположения», может показаться незначительной, особенно когда чат-бот часто застревает в таких местах, как Виридианский лес, иногда на несколько дней, из-за лабиринтоподобного дизайна уровня. Тем не менее это важный этап для типа системы ИИ, которую представляет Claude 3.7.
Как и многие современные передовые системы ИИ, Claude 3.7 Sonnet — это модель, основанная на рассуждениях, предназначенная для решения проблем путём разбиения их на более мелкие части. «Многих наших клиентов интересует, насколько эффективна Claude в качестве агента», — объясняет Хершей. Для непосвящённых агенты или агентские ИИ — это системы, предназначенные для планирования и выполнения сложных задач без надзора человека. Сейчас большинство людей представляют себе ИИ как пустую чат-бокс, ожидающую вопроса, но чат-боты — это только потребительское лицо отрасли; агентские системы представляют собой постепенный, но важный шаг к обещанию искусственного общего интеллекта.
С этой точки зрения есть несколько моментов, которые делают «Claude Plays Pokémon» интересным. Во-первых, это удивительный факт: Хершей делегировал большую часть программирования, сделавшего проект возможным, кодирующему агенту Anthropic, включая оверлей, который позволяет Claude понимать игровой мир Pokémon Red.
Во-вторых, и что более важно, Claude не был предварительно обучен игре в Pokémon Red. Чат-бот знает некоторые основы игры, такие как имена каждого лидера спортзала и порядок, в котором игрок должен их победить, но у него нет сотен лет игрового опыта, как у некоторых специализированных систем ИИ. «Можно запустить модель в игру без подготовки, без руководства, и она сможет всему научиться сама», — говорит он. «Я стремлюсь быть как можно ближе к этому».
Хершейу пришлось помочь Claude. Я уже упоминал оверлей, который позволяет ему интерпретировать интерфейс Pokémon Red. Пиксельное искусство — это то, с чем борются все системы ИИ, и 3.7 Sonnet не исключение. Как люди, мы используем наше воображение, чтобы заполнить детали, предложенные всего несколькими пикселями. Более того, Claude не «видит» так, как мы.
Если присмотреться, можно заметить, что каждый раз, когда он перемещает персонажа игрока, он делает несколько вводов, прежде чем переоценить свою позицию. Между этими кадрами у Claude нет сенсорного ввода. Он не видит, как Ред ходит, и не «слышит», когда его вводы заставляют Реда врезаться в дерево или какое-либо другое препятствие. Плохое «зрение» Claude — одна из основных причин, по которым он struggles with the game; фактически Хершейу пришлось дать чат-боту возможность читать память игры, чтобы он реже путал элементы интерфейса.
Если бы целью проекта было победить в Pokémon Red, это было бы легко. Хершей мог бы запрограммировать маршрут через игру для чат-бота, но в этом случае он бы тестировал только то, насколько хорошо Claude следует жёсткому набору инструкций. «Claude довольно хорош в этом», — говорит Хершей. «Я знал это. Мы все это знали».
Вместо этого, оставив Claude на произвол судьбы, новая модель показала, что она лучше планирует, придумывает новые стратегии и в конечном итоге пробует что-то новое, когда её предположения оказываются неверными. Одним из наиболее интересных решений, которые Claude разработала во время своего третьего прохождения игры, было намеренное причинение всем своим покемонам обморока, чтобы сбежать с горы Мун.
Тем не менее Claude могла бы быть намного лучше в краткосрочном и долгосрочном планировании. В том же примере, который я только что упомянул, Claude удалила все свои заметки о горе Мун после возрождения в близлежащем центре покемонов, ошибочно полагая, что успешно преодолела пещеру. Один из его наиболее перспективных проходов закончился после того, как Claude не смогла понять, что ей нужно поговорить с Биллом, чтобы продвинуться дальше по игре. Она попала в бесконечный цикл принятия плохих решений.
«В дальнейшем я не знаю, насколько полезным будет это внутри компании в качестве эталона. Возможно, обладая небольшим набором навыков, Claude немного улучшится и победит в игре, и тогда эталоном это будет не так интересно», — признаёт Хершей. «Также может случиться, что есть вещи, которые я ещё не совсем понимаю о том, что сделает нашу следующую модель хорошей, и тогда мы всё равно будем узнавать всё больше промежуточных вещей по пути».
Что касается того, что будет дальше, Хершей говорит, что у него нет долгосрочной стратегии для «Claude Plays Pokémon». «Я потратил столько времени — моя жена сказала бы, что слишком много времени — глядя на эту штуку», — говорит он, смеясь. У меня также создаётся впечатление, что Хершей ещё не готов закрыть книгу над проектом. «Я предполагаю, что всякий раз, когда выходит новая модель, я буду играть с ней в покемонов и, вероятно, покажу миру это тоже».
До тех пор Anthropic, после недавнего сброса, продолжает транслировать «Claude Plays Pokémon» на Twitch. Проект оказался достаточно успешным, чтобы вдохновить независимого разработчика на создание потока «Gemini Plays Pokémon», и, если мне не изменяет интуиция, вскоре мы увидим больше подражателей.
Добавить комментарий