practical-reinforcement-learning

Code solutions to the Practical Reinforcement Learning course by National Research Higher School of Economics (HSE).

Week1: using the gym interface to interact with environments; crossentropy method; deep crossentropy method.
Week2 value based methods: the action value function.
Week3 model free methods: q-learning; SARSA; expected-value SARSA; experience replay.
Week4 approximating q values: deep q network implementations.
Week5 policy-based methods: REINFORCE & advantage actor-critic implementation.
Week6 uncertainty-based exploration: multi-armed bandits; monte carlo tree search (MCTS); seq2seq with RL.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
week1		week1
week2_value_based		week2_value_based
week3_model_free		week3_model_free
week4_approx_value_methods		week4_approx_value_methods
week5_policy_based		week5_policy_based
week6_uncertainty_based_monte_carlo		week6_uncertainty_based_monte_carlo
README.md		README.md

Provide feedback