Люди превзошли искусственный интеллект на международном математическом конкурсе, несмотря на высокие результаты ИИ

Модели генеративного искусственного интеллекта от Google и OpenAI не смогли превзойти людей на престижном международном математическом конкурсе, несмотря на то, что впервые достигли результатов, соответствующих уровню «золото».

Ни одна из моделей не получила максимальных баллов, в отличие от пяти молодых людей, участвовавших в Международной математической олимпиаде (IMO) — престижном ежегодном соревновании, где участникам должно быть менее 20 лет.

Google

В понедельник компания Google сообщила, что продвинутая версия её чат-бота Gemini решила пять из шести математических задач, предложенных на IMO, которая проходила в австралийском Квинсленде в этом месяце.

«Мы можем подтвердить, что Google DeepMind достигла столь желанного рубежа, заработав 35 баллов из возможных 42 — это золотой результат», — процитировал президент IMO Грегор Долинар заявление американского технологического гиганта.

Решения, представленные моделями, были «поразительными во многих отношениях». Члены жюри IMO сочли их ясными, точными, и большинству из них было легко следовать.

Около 10% участников-людей завоевали золотые медали, а пятеро получили идеальные результаты — 42 балла.

OpenAI

Производитель чат-бота ChatGPT в США, компания OpenAI, сообщила, что её экспериментальная модель рассуждений набрала 35 баллов — золотой уровень — на тесте.

Результат «достиг давней амбициозной цели в области искусственного интеллекта» на «самом престижном математическом конкурсе в мире», написал исследователь OpenAI Александр Вэй в социальных сетях.

«Мы оценили наши модели на задачах IMO 2025 по тем же правилам, что и участников-людей», — сказал он. «Для каждой задачи три бывших медалиста IMO независимо оценили представленное моделью доказательство».

Google на прошлогодней IMO

В прошлом году Google получил серебряный результат на IMO в британском городе Бат, решив четыре из шести задач. По словам компании, на это потребовалось от двух до трёх дней вычислений — гораздо больше времени, чем в этом году, когда модель Gemini решила задачи в рамках установленного 4,5-часового лимита.

Участие технологических компаний

IMO сообщила, что технологические компании «в частном порядке тестировали модели искусственного интеллекта с закрытым исходным кодом на задачах этого года», с которыми столкнулись 641 участник конкурса из 112 стран.

«Это очень интересно наблюдать за прогрессом в математических возможностях моделей искусственного интеллекта», — сказал президент IMO Долинар.

Организаторы конкурса не смогли проверить, сколько вычислительных мощностей было использовано моделями ИИ и было ли в этом процессе человеческое участие, предупредил он.

Источник

Google

OpenAI

Google на прошлогодней IMO

Участие технологических компаний

Оставьте комментарий Отменить ответ