Active Reinforcement Learning with Monte-Carlo Tree Search.

Sebastian Schulze Owain Evans

Published in: CoRR (2018)

Keyphrases

monte carlo tree search
reinforcement learning
temporal difference
bayesian reinforcement learning
reinforcement learning methods
monte carlo
temporal difference learning
tree search algorithm
evaluation function
function approximation
reinforcement learning algorithms
model free
state space
supervised learning
machine learning
multi agent
alpha beta search
monte carlo search
action selection
control problems
optimal policy
learning process
markov decision process
function approximators
game tree
markov chain
dynamic programming
learning algorithm