Temporal Difference Learning of Backgammon Strategy.

Published in: ML (1992)

Keyphrases

linear programming
temporal difference learning
fixed point
function approximation
evaluation function
reinforcement learning
temporal difference
game playing
approximate value iteration
markov decision process
reinforcement learning algorithms
monte carlo
optimal policy
dynamic environments
model free
sufficient conditions
function approximators
semi supervised
support vector