Temporal-Difference Networks.

Richard S. Sutton Brian Tanner

Published in: NIPS (2004)

Keyphrases

temporal difference
td learning
reinforcement learning
evaluation function
function approximation
monte carlo
model free
step size
policy evaluation
temporal difference learning
action selection
reinforcement learning algorithms
temporal difference methods
actor critic
markov chain
supervised learning
learning experience
policy iteration
connectionist networks
cost function
multiscale
genetic algorithm