DRL Course | Value Function Approximation. Deep Q-Networks (DQN)
Курс Deep Reinforcement Learning:
Сезон курсов:
В пятой лекции:
Рассматриваются MDP с бесконечным пространством состояний;
Обсуждаются аппроксимации Q-функции с помощью линейной комбинации и нейронных сетей;
Выводится алгоритм Deep Q-Networks (DQN);
Обсуждаются его различные модификации
Наши соц.сети:
Telegram:
Вконтакте: