Почему ИИ плохо справляется с созданием часов

Почему ИИ плохо справляется с созданием часов?

Я не могу перестать думать о сайте AI World Clocks. Идея проста: всем основным моделям ИИ на рынке предлагается написать код для часов, и вы можете увидеть результаты. Улов: все они — красивые катастрофы.

Цифры, кажется, постоянно оказываются не на своём месте, а иногда и вовсе за пределами самих часов. Стрелки могут быть, а могут и не быть в правильном положении, а иногда и вовсе улетают в космос за пределы часов. Даже те часы, которые выглядят довольно неплохо, всё равно выглядят как-то не так.

«Указание времени — это очень человеческое дело, очень простое для нас и то, чему мы учимся в очень юном возрасте», — сказал мне в интервью Брайан Мур, художник, создавший сайт. «Забавно и смешно перевернуть ситуацию — увидеть то, что человек может сделать очень легко, а компьютер — нет».

Я держал этот сайт открытым на протяжении всего процесса написания этой статьи и могу подтвердить: это очень забавно. Но почему ИИ так плох в этом?

Ну, нужно учитывать, что сайт ограничивает все модели примерно 2000 токенами для создания своих часов и использует один и тот же запрос для всех моделей. Вы могли бы, имея неограниченную вычислительную мощность и очень конкретный запрос, получить более качественные часы от системы ИИ. Но вопрос остаётся: почему это так сложно для систем ИИ? Причины указывают на то, как работают системы ИИ.

ИИ плохо справляется с указанием времени

ИИ не только плохо справляется с созданием часов, но и с их чтением. Исследование 2025 года, проведённое технологом Алеком Сафаром, показывает, что люди с точностью 89,1% определяют время по аналоговым часам, в то время как топовый ИИ — только 39,4% точности.

Это исследование лишь выдвигает гипотезы о причинах этого, но потенциальные объяснения интересны. Первое — это то, что в наборах данных просто недостаточно изображений часов, чтобы модели ИИ могли научиться точно определять время. Другое — то, что изображения часов трудно описать с помощью языка, что требуется большим языковым моделям для их обработки.

Другое исследование 2025 года, проведённое Школой информатики Эдинбургского университета, также показало, что все основные большие языковые модели с трудом понимают время, когда им показывают изображение аналоговых часов.

«Наши выводы показывают, что для успешного временного рассуждения требуется сочетание точного визуального восприятия, численных вычислений и структурированного логического вывода, которого современные MLLM пока не освоили», — говорится в исследовании.

Как я уже сказал, ни одно из этих исследований не претендует на полное понимание того, почему ИИ не очень хорош в этих задачах. Однако есть несколько интересных факторов, которые следует учитывать, включая наборы данных, которые ИИ использует для понимания мира.

Нужно понимать, что большие языковые модели, называемые в современном обиходе «ИИ», на самом деле не умеют считать. Это противоречит интуиции, потому что мы привыкли думать о компьютерах как о математических машинах, но современная технология ИИ основана больше на распознавании закономерностей. Часы — интересный пример этого. Системы вместо того, чтобы вычислять углы или положение стрелок для определения времени, пытаются угадать время на основе распознавания закономерностей. Что, если подумать, не так уж сильно отличается от того, как я лично определяю время, глядя на часы — системы ИИ просто плохо справляются с этим.

Проблема 10:10

Зайдите в свой инструмент поиска изображений и введите «watch», затем следите за временем, которое вы видите на циферблатах. Вы быстро заметите, что большинство аналоговых часов установлено на десять минут после десяти (10:10).

Почему именно это время? Потому что маркетинг. Продавцы часов и часов давно знают, что установка часов на 10:10 делает их более привлекательными для потенциальных покупателей. Исследование 2017 года, опубликованное во Frontiers in Psychology, предполагает, что это может быть связано с тем, что два угла стрелок напоминали человеческую улыбку. Ещё одно соображение заключается в том, что в 10:10 стрелки не закрывают логотип, название бренда или какие-либо усложнения, такие как дата. Это делает изображение привлекательным и стало стандартом для маркетинга часов.

Одним из следствий этого является то, что многие изображения часов в Интернете установлены на 10:10. Это, в свою очередь, означает, что значительная часть часов в наборах данных ИИ установлена на одно и то же время. Попросите любую систему ИИ нарисовать вам часы, и в большинстве случаев она установит их на 10:10 — иногда даже если вы попросите другое время. Отчасти именно поэтому Мур и создал свой сайт с забавными плохими часами ИИ.

«Я попросил генератор изображений дать мне изображение часов в определённое время, и он определённо не смог этого сделать», — сказал он мне. «Я получал много 10:10, даже несмотря на то, что давал ему множество конкретных подсказок». Мур не одинок — по крайней мере, один пользователь Reddit заметил это, пытаясь создать часы, установленные на определённое время.

Это всего лишь одна небольшая кроличья нора о часах и часах, но она указывает на то, как данные, к которым имеют доступ системы ИИ, могут повлиять на их возможности. Ещё одна теория, которая возникает в обсуждениях по этому поводу: рисование часов — это распространённый тест на деменцию, что, в свою очередь, означает, что в Интернете есть несколько очень неточных рисунков часов.

Люди, создающие системы ИИ, не до конца понимают, как они работают, поэтому многое здесь — это просто предположения. И именно это делает сайт с часами ИИ таким забавным: это взгляд на то, как работают эти системы.

Источник