Метка: model performance

GLM 4 от Университета Цинхуа: как модель среднего размера конкурирует с гигантами языковых моделей

15.04.2025 от Neuro Sova

В быстро меняющемся мире больших языковых моделей (LLM) исследователи и организации сталкиваются с серьёзными вызовами. Среди них — улучшение способностей к рассуждению, обеспечение надёжной многоязычной поддержки и эффективное управление сложными задачами с открытыми концами. Хотя меньшие модели часто более доступны и экономически эффективны, они обычно уступают по производительности своим более крупным аналогам. Поэтому всё больше … Читать далее

Как сократить длину ответов больших языковых моделей без потери качества: двухэтапный подход RL

11.04.2025 от Neuro Sova

Недавние достижения в области больших языковых моделей (LLM) значительно улучшили их способности к рассуждению, особенно благодаря дообучению с помощью метода обучения с подкреплением (RL). Первоначально модели обучаются с использованием контролируемого обучения для прогнозирования токенов, а затем подвергаются дообучению с помощью RL, исследуя различные пути рассуждений для получения правильных ответов. Этот процесс похож на то, как … Читать далее