OpenAI представила две «открытые» модели ИИ для логических рассуждений

OpenAI объявила во вторник о запуске двух открытых моделей искусственного интеллекта с возможностями, сопоставимыми с ее O-серией. Обе модели доступны для бесплатной загрузки на платформе Hugging Face, сообщила компания, охарактеризовав их как «передовые» по результатам нескольких бенчмарков для сравнения открытых моделей.

Модели представлены в двух вариантах: более крупная и мощная gpt-oss-120b, способная работать на одной GPU-карте Nvidia, и облегченная версия gpt-oss-20b, которая может запускаться на потребительском ноутбуке с 16 ГБ памяти.

Этот запуск стал первым релизом открытой языковой модели от OpenAI со времен GPT-2, выпущенной более пяти лет назад.

Во время брифинга OpenAI заявила, что ее открытые модели смогут направлять сложные запросы к облачным ИИ-моделям, как ранее сообщал TechCrunch. Это означает, что если открытая модель OpenAI не справляется с определенной задачей (например, обработкой изображения), разработчики могут подключить ее к более продвинутым закрытым моделям компании.

Хотя на ранних этапах OpenAI открывала исходный код своих моделей, в последующие годы компания в основном придерживалась проприетарного подхода. Эта стратегия позволила создать крупный бизнес, продавая доступ к ИИ-моделям через API для предприятий и разработчиков.

Однако CEO Сэм Альтман заявил в январе, что компания, возможно, оказалась «не на той стороне истории» в вопросе открытости технологий. Сегодня OpenAI сталкивается с растущим давлением со стороны китайских ИИ-лабораторий, включая DeepSeek, Qwen от Alibaba и Moonshot AI, которые разработали одни из самых мощных открытых моделей в мире. В июле администрация Трампа также призвала американских разработчиков чаще открывать исходный код технологий для глобального распространения ИИ, соответствующего американским ценностям.

Выпуском gpt-oss OpenAI надеется заручиться поддержкой как разработчиков, так и администрации Трампа, наблюдающих за ростом влияния китайских лабораторий в opensource-пространстве.

«Наша миссия с 2015 года — обеспечить создание ИИ, приносящего пользу человечеству. Мы рады, что мир сможет развивать открытый стек ИИ, созданный в США на основе демократических ценностей», — заявил Сэм Альтман в официальном обращении.

**Производительность моделей**
OpenAI утверждает, что достигла лидерства среди открытых моделей. На тесте Codeforces (с инструментами) gpt-oss-120b и gpt-oss-20b набрали 2622 и 2516 баллов соответственно, опередив DeepSeek R1, но уступив O3 и O4-mini.

На сложном экзамене Humanity’s Last Exam (HLE) модели показали 19% и 17.3%, превзойдя аналоги от DeepSeek и Qwen, но отстав от O3.

При этом открытые модели OpenAI демонстрируют значительно больше галлюцинаций, чем O3 и O4-mini. На внутреннем тесте PersonQA, измеряющем точность знаний о людях, gpt-oss-120b и gpt-oss-20b дали ложные ответы в 49% и 53% случаев — втрое выше, чем у O1 (16%), и больше, чем у O4-mini (36%).

**Обучение моделей**
Модели обучались по схожим с проприетарными методикам, включая архитектуру mixture-of-experts (MoE) для эффективного использования параметров. Например, gpt-oss-120b с 117 млрд параметров активирует только 5.1 млрд на токен.

Применялось высокопроизводительное обучение с подкреплением (RL) для тренировки ИИ-агентов, способных использовать веб-поиск или исполнение Python-кода. Однако модели работают только с текстом, не генерируя изображения или аудио.

**Лицензирование и безопасность**
Модели выпущены под лицензией Apache 2.0, разрешающей коммерческое использование без выплат OpenAI. Однако данные обучения остаются закрытыми, что связано с текущими судебными исками о нарушении авторских прав.

Выпуск неоднократно откладывался из-за проверок безопасности. Тесты OpenAI и третьих сторон показали, что тонкая настройка gpt-oss может слегка повысить возможности в биологической сфере, но не достигает «опасного» порога.

Несмотря на текущее лидерство, разработчики ожидают новых моделей от DeepSeek R2 и суперинтеллектуальной лаборатории Meta.