DSGym предлагает субстрат на основе контейнеров для создания и тестирования агентов в области обработки данных
DSGym — это фреймворк, разработанный исследователями из Стэнфордского университета, Together AI, Дьюкского университета и Гарвардского университета. Он предназначен для оценки и обучения агентов в области обработки данных более чем на 1 тыс. задачах. Почему существующие тесты не соответствуют требованиям? Исследовательская группа провела анализ существующих тестов, которые утверждают, что проверяют агентов, работающих с данными. Когда файлы … Читать далее