Accelerated Gradient Temporal Difference Learning.

Yangchen Pan Adam M. White Martha White

Published in: CoRR (2016)

Keyphrases

temporal difference learning
function approximation
fixed point
reinforcement learning
evaluation function
game playing
approximate value iteration
temporal difference
reinforcement learning algorithms
gaussian process
markov decision process
function approximators
neural network
decision making
learning process
learning tasks