Метка: model optimization
-
Оптимизация моделей глубокого обучения с помощью весовой квантизации: практическое руководство по работе с ResNet18 в PyTorch
В современной области глубокого обучения оптимизация моделей для развёртывания в условиях ограниченных ресурсов становится как никогда важной. Весовая квантизация решает эту задачу, снижая точность параметров модели, обычно с 32-битных чисел с плавающей запятой до представлений с меньшей разрядностью. Это позволяет создавать более компактные модели, которые могут работать быстрее на оборудовании с ограниченными ресурсами. В этом…
-
Как сократить длину ответов больших языковых моделей без потери качества: двухэтапный подход RL
Недавние достижения в области больших языковых моделей (LLM) значительно улучшили их способности к рассуждению, особенно благодаря дообучению с помощью метода обучения с подкреплением (RL). Первоначально модели обучаются с использованием контролируемого обучения для прогнозирования токенов, а затем подвергаются дообучению с помощью RL, исследуя различные пути рассуждений для получения правильных ответов. Этот процесс похож на то, как…