Temporal-Difference Networks.

Richard S. Sutton Brian Tanner

Published in: CoRR (2015)

Keyphrases

temporal difference
td learning
evaluation function
reinforcement learning
function approximation
model free
temporal difference learning
step size
monte carlo
reinforcement learning algorithms
action selection
supervised learning
policy evaluation
temporal difference methods
decision making
policy iteration
actor critic
evolutionary algorithm