Технический отчёт: оценка производительности и базовых характеристик моделей GPT-OSS-Safeguard-120B и GPT-OSS-Safeguard-20B.

GPT-OSS-Safeguard-120B и GPT-OSS-Safeguard-20B — это две модели для рассуждений с открытым весом, дообученные на основе моделей GPT-OSS. Они обучены делать выводы в соответствии с предоставленной политикой и маркировать контент в соответствии с этой политикой.

В этом отчёте мы описываем возможности GPT-OSS-Safeguard и предоставляем базовые оценки безопасности для моделей GPT-OSS-Safeguard, используя базовые модели GPT-OSS в качестве эталона.

Дополнительную информацию о разработке и архитектуре базовых моделей GPT-OSS можно найти в оригинальной карточке модели GPT-OSS.

1. Какие основные функции выполняют модели GPT-OSS-Safeguard-120B и GPT-OSS-Safeguard-20B?

Ответ: Модели GPT-OSS-Safeguard-120B и GPT-OSS-Safeguard-20B выполняют функции рассуждений и вывода в соответствии с предоставленной политикой, а также маркировку контента в соответствии с этой политикой.

2. На основе каких моделей были обучены GPT-OSS-Safeguard-120B и GPT-OSS-Safeguard-20B?

Ответ: Модели GPT-OSS-Safeguard-120B и GPT-OSS-Safeguard-20B были обучены на основе моделей GPT-OSS.

3. Для чего используются базовые оценки безопасности для моделей GPT-OSS-Safeguard?

Ответ: Базовые оценки безопасности для моделей GPT-OSS-Safeguard используются для оценки их безопасности и сравнения с базовыми моделями GPT-OSS, которые служат эталоном.

4. Где можно найти дополнительную информацию о разработке и архитектуре базовых моделей GPT-OSS?

Ответ: Дополнительную информацию о разработке и архитектуре базовых моделей GPT-OSS можно найти в оригинальной карточке модели GPT-OSS.

Источник