Reinforcement Learning 2: Q-learning

Рассмотрим первый рабочий метод Q-learning, который лежит в основе множества других алгоритмов обучения с подкреплением. Также, с помощью этого метода решим две задачи из тех, которые были на предыдущем семинаре. Consider the first working method of Q-learning, which underlies many other reinforcement learning algorithms. Also, using this method, we will solve two problems from those that were at the previous seminar. 00:00:00 Начало видео 00:08:24 Решение задач первой лекции 00:12:23 Уравнение Беллмана без действий 00:26:01 Метод Монте Карло 00:32:26 Уравнение Беллмана с действиями 00:36:43 Стратегии жадные и не очень 00:41:53 Максимизация Q-функции 00:47:46 Метод Монте Карло 00:55:56 Q-learning 01:04:25 Frozen Lake 01:06:23 Frozen Lake: Q-learning 01:28:12 Mountain Car 01:37:32 Mountain Car: Q-learning в динамике Ukrainian IT-company. Machine Learning | Data Science | Artificial Intelligence #artificialintelligence #MachineLearning #ReinforcementLearning #ИскусственныйИнтеллект #Машинноеобучение

16 views