Temporal-Difference Search in Computer Go.

David Silver Richard S. Sutton Martin Müller

Published in: ICAPS (2013)

Keyphrases

temporal difference
temporal difference learning
monte carlo
evaluation function
monte carlo tree search
game tree search
td learning
reinforcement learning
search algorithm
function approximation
policy evaluation
step size
policy iteration
model free
action selection
markov chain
supervised learning
least squares
temporal difference methods