Regularized Gradient Temporal-Difference Learning.

Dominik Meyer Hao Shen Klaus Diepold

Published in: CoRR (2016)

Keyphrases

temporal difference learning
fixed point
function approximation
game playing
reinforcement learning
evaluation function
approximate value iteration
temporal difference
reinforcement learning algorithms
least squares
markov decision process
monte carlo
neural network
linear programming
function approximators