Модели генеративного искусственного интеллекта от Google и OpenAI не смогли превзойти людей на престижном международном математическом конкурсе, несмотря на то, что впервые достигли результатов, соответствующих уровню «золото».
Ни одна из моделей не получила максимальных баллов, в отличие от пяти молодых людей, участвовавших в Международной математической олимпиаде (IMO) — престижном ежегодном соревновании, где участникам должно быть менее 20 лет.
В понедельник компания Google сообщила, что продвинутая версия её чат-бота Gemini решила пять из шести математических задач, предложенных на IMO, которая проходила в австралийском Квинсленде в этом месяце.
«Мы можем подтвердить, что Google DeepMind достигла столь желанного рубежа, заработав 35 баллов из возможных 42 — это золотой результат», — процитировал президент IMO Грегор Долинар заявление американского технологического гиганта.
Решения, представленные моделями, были «поразительными во многих отношениях». Члены жюри IMO сочли их ясными, точными, и большинству из них было легко следовать.
Около 10% участников-людей завоевали золотые медали, а пятеро получили идеальные результаты — 42 балла.
OpenAI
Производитель чат-бота ChatGPT в США, компания OpenAI, сообщила, что её экспериментальная модель рассуждений набрала 35 баллов — золотой уровень — на тесте.
Результат «достиг давней амбициозной цели в области искусственного интеллекта» на «самом престижном математическом конкурсе в мире», написал исследователь OpenAI Александр Вэй в социальных сетях.
«Мы оценили наши модели на задачах IMO 2025 по тем же правилам, что и участников-людей», — сказал он. «Для каждой задачи три бывших медалиста IMO независимо оценили представленное моделью доказательство».
Google на прошлогодней IMO
В прошлом году Google получил серебряный результат на IMO в британском городе Бат, решив четыре из шести задач. По словам компании, на это потребовалось от двух до трёх дней вычислений — гораздо больше времени, чем в этом году, когда модель Gemini решила задачи в рамках установленного 4,5-часового лимита.
Участие технологических компаний
IMO сообщила, что технологические компании «в частном порядке тестировали модели искусственного интеллекта с закрытым исходным кодом на задачах этого года», с которыми столкнулись 641 участник конкурса из 112 стран.
«Это очень интересно наблюдать за прогрессом в математических возможностях моделей искусственного интеллекта», — сказал президент IMO Долинар.
Организаторы конкурса не смогли проверить, сколько вычислительных мощностей было использовано моделями ИИ и было ли в этом процессе человеческое участие, предупредил он.
© 2025 AFP