Метка: deep learning
-
Оптимизация моделей глубокого обучения с помощью весовой квантизации: практическое руководство по работе с ResNet18 в PyTorch
В современной области глубокого обучения оптимизация моделей для развёртывания в условиях ограниченных ресурсов становится как никогда важной. Весовая квантизация решает эту задачу, снижая точность параметров модели, обычно с 32-битных чисел с плавающей запятой до представлений с меньшей разрядностью. Это позволяет создавать более компактные модели, которые могут работать быстрее на оборудовании с ограниченными ресурсами. В этом…
-
VAPO: инновационный фреймворк для обучения с подкреплением в задачах длинного логического вывода
В обучении с подкреплением (Reinforcement Learning, RL) больших языковых моделей (Large Language Models, LLM) методы, не основанные на оценке ценности, такие как GRPO и DAPO, продемонстрировали высокую эффективность. Однако настоящий потенциал заключается в методах, основанных на оценке ценности, которые позволяют более точно распределять «заслуги», корректно отслеживая влияние каждого действия на последующие результаты. Такая точность имеет…