Gradient Temporal Difference Networks.

Published in: EWRL (2012)

Keyphrases

temporal difference
td learning
reinforcement learning
evaluation function
function approximation
monte carlo
model free
reinforcement learning algorithms
action selection
step size
temporal difference learning
policy evaluation
temporal difference methods
supervised learning
policy iteration
gradient method
active learning
function approximators
data mining
predictive state representations