Meta AI представляет DreamGym: синтезатор текстового опыта для агентов обучения с подкреплением
DreamGym — это новый фреймворк от Meta, который переосмысливает узкие места в обучении с подкреплением (RL) как задачу моделирования. Вместо прямого запуска RL в таких средах, как WebShop, ALFWorld и WebArena Lite, он изучает модель опыта, основанную на рассуждениях, которая имитирует их полностью в тексте. Почему RL для агентов в реальных средах не масштабируется? Текущие … Читать далее