Вы не поверите, но уже 10 лет прошло с тех пор, как я создал игру «Это простое число?». Я как-то могу в это поверить, потому что установил себе напоминание об этом в календаре.
В 2016 году в игру сыграли 350 000 раз, и я написал пост с анализом собранных данных. Спустя 10 лет я решил взглянуть ещё раз.
Вот вопросы, на которые я хочу ответить:
* Сколько игр было сыграно?
* Стали ли люди лучше играть в игру?
* Увеличился ли средний балл?
* Стали ли какие-то числа Гротендика общеизвестными?
* Каков уровень мошенничества?
На 8 марта 2026 года я зафиксировал 8 209 714 игр. Миллионная игра состоялась 19 октября 2018 года, а отметка в 8 миллионов была пройдена всего несколько месяцев назад, 28 ноября 2025 года.
(Но у меня есть веские основания полагать, что немалая часть из них — не настоящие попытки человека. Я удалил около 730 000 явно недействительных попыток из набора данных, по причине, которую объясню позже.)
Теперь, чтобы углубиться в статистические вопросы, я собираюсь перезапустить блокнот IPython, который написал в 2016 году, с последними данными. Я занятой человек и у меня нет времени применять навыки анализа данных за десятилетие.
Начну с нового графика: общее количество записанных игр с течением времени. Оно гораздо более стабильное, чем я ожидал, за исключением большого скачка в конце 2022 года. Похоже, оно слегка изгибается вверх.
Я решил изучить этот большой скачок. Оказывается, кто-то спамил записи 785 964 копиями одной и той же игры, заканчивающейся на 87. Я просто удалю их.
Итак, график попыток с течением времени теперь выглядит так:
Единственная очевидная прямая линия — горизонтальный участок в 2020 году, когда, должно быть, не записывались данные. Я не помню, чтобы это происходило, но помню, что в то время у меня было много дел…
Возвращаясь к исходному ноутбуку, вот график баллов в зависимости от затраченного времени, 2016 год против 2026 года.
Оценка в зависимости от затраченного времени в 2016 году
Оценка в зависимости от затраченного времени в 2026 году
На графиках много чётких линий, соответствующих мошенничеству, и много неправдоподобно высоких баллов. Интересно, являются ли высокие баллы, которые выглядят случайным образом разбросанными, по сравнению с теми, что на горизонтальных линиях, людьми, которые написали медленные скрипты для игры за них, а не просто отправили массовые данные.
Здесь приведены оценки, ограниченные диапазоном, который, как я думаю, достижим для людей. После просмотра видео, где кто-то набрал более 100, я расширил диапазон оценок до 150.
2016 год
2026 год
Самая распространённая оценка была 275. Теперь она составляет 375. Это странно.
59% игр закончились на составном числе, как и в 2016 году.
На «День подарков» в 2022 году кто-то решил отправить 1139 фальшивых записей с последовательностью: «пожалуйста, измените положение кнопки повторного запуска, так как я продолжаю случайно перезапускать игру». Справедливое замечание. Электронная почта была бы проще.
Чтобы определить, склонны ли люди чаще ошибаться на составных числах или простых, я вычислил условные вероятности:
$\begin{align}
\Pr(\text{fail} \mid \text{prime}) &= 14,7\% & (10,4\% \text{ в 2016 году}) \\
\Pr(\text{fail} \mid \text{composite}) &= 18,2\% & (12,5\% \text{ в 2016 году}) \\
\end{align}$
Я думаю, тот факт, что эти вероятности выше, означает, что люди стали немного хуже играть в игру. Звучит правильно?
Вот квантили оценок:
|Процентиль|Оценка|
|——-|——-|
| 50% | 4 |
| 25% | 7 |
| 10% | 18 |
| 5% | 28 |
| 2,5% | 40 |
| 0,1% | 726 |
Графики оценки и затраченного времени сгладились до того, что выглядит как степенной закон.
В 2016 году я рассмотрел, какие числа являются «гротендиковскими»: числа, которые большинство людей неправильно классифицируют как простые или составные.
Таблица из 10 наиболее часто встречающихся окончательных чисел существенно не изменилась. 1 и 39 поменялись местами, но 51 сохраняет свою позицию как наиболее гротендиковское число. 87 полностью выпало из топ-10, опустившись на 14-е место. Может быть, поэтому бюллетень был подделан?
| Окончательное число | Причина окончания | Частота |
|——-|——-|——-|
| 51 | составное | 39 878 95,37% |
| 57 | составное | 39 480 85,32% |
| 1 | составное | 2 589 493,49% |
| 39 | составное | 2 578 883,47% |
| 63 | составное | 2 106 672,83% |
| 49 | составное | 2 048 562,76% |
| 5 | составное | 1 93 553 2,60% |
| 69 | простое | 192 822 2,60% |
| 27 | составное | 181 129 2,44% |
| 9 | составное | 180 842 2,38% |
Но, если посмотреть на вещи немного по-другому, ситуация немного меняется. Вероятность того, что число будет неправильно классифицировано после его показа, немного выше для 57 — 41,5%, по сравнению с 51 — 41,0%. Так что больше игр заканчиваются на 51, потому что это меньшее число, но если кто-то доходит до 57, он с большей вероятностью скажет, что это простое число. Гротендик оправдан.
Наконец, вот график $\Pr(\text{fail} \mid \text{shown})$, чтобы визуально определить гротендиковские числа:
Для меня выделяются числа 51, 57, 87, 91 и 119. Можно также привести доводы в пользу 39, но это не такой большой аутсайдер.
Не похоже, что за 10 лет сколько-нибудь заметное количество людей узнало, что 51 не является простым числом. Я выберу верить в то, что это не одни и те же люди играют в течение десятилетия и упорно отказываются учиться, а постоянный поток новых игроков, которые в конечном итоге получат сообщение.
Итак, вот некоторые актуальные цифры.
Я действительно горжусь этой игрой. Мне нравилось ходить в школы и разговаривать с учителями, которые говорили мне, что играют в игру, когда классу нужен перерыв или разминка в начале дня, и мне нравится, когда они удивляются, узнав, что я написал её. И 7,5 миллиона попыток в математической игре — это немалое достижение!