Google AI представляет обучение с подкреплением под контролем (SRL): пошаговая система с экспертными траекториями для обучения небольших языковых моделей решению сложных задач

Команда исследователей из Google Cloud AI Research и UCLA разработала систему обучения с подкреплением под контролем (Supervised Reinforcement Learning, SRL). Она позволяет небольшим моделям на самом деле учиться решать сложные математические задачи и задачи для агентов, с которыми не справляются обычные методы тонкой настройки под контролем и обучения с подкреплением, ориентированного на результат. Как небольшая … Читать далее

Оценка моего учителя-ИИ?

Восприятие студентами чат-ботов повлияет на то, как они будут учиться с помощью ИИ. 1. Трансформация на пороге. После многолетнего шествия образовательных технологических продуктов, которые когда-то обещали всё изменить, теперь настала очередь ИИ. Глобальные организации, такие как Организация экономического сотрудничества и развития (ОЭСР), а также правительственные органы представляют ИИ как «преобразующий». Известные компании, занимающиеся разработкой ИИ, … Читать далее