Incremental Truncated LSTD.

Clement Gehring Yangchen Pan Martha White

Published in: IJCAI (2016)

Keyphrases

reinforcement learning
temporal difference
least squares
policy evaluation
policy iteration
td learning
function approximation
temporal difference learning
model free
monte carlo
evaluation function
linear approximation
reinforcement learning algorithms
markov decision processes
reinforcement learning methods
learning algorithm
game playing
step size
optimal policy
machine learning
constrained optimization
radial basis function