Historical Temporal Difference Learning: Some Initial Results.

Hengshuai Yao Diao Dongcui Zengqi Sun

Published in: IMSCCS (2) (2006)

Keyphrases

temporal difference learning
fixed point
function approximation
reinforcement learning
evaluation function
game playing
temporal difference
approximate value iteration
reinforcement learning algorithms
markov decision process
model free
function approximators
learning algorithm
image segmentation
markov decision processes