Temporal-Difference Networks with History.

Brian Tanner Richard S. Sutton

Published in: IJCAI (2005)

Keyphrases

temporal difference
td learning
reinforcement learning
function approximation
evaluation function
monte carlo
temporal difference learning
action selection
step size
model free
reinforcement learning algorithms
policy iteration
supervised learning
feature extraction
data mining
optimal control
learning algorithm
policy evaluation
machine learning