Postponed Updates for Temporal-Difference Reinforcement Learning.

Harm van Seijen Shimon Whiteson

Published in: ISDA (2009)

Keyphrases

temporal difference
reinforcement learning
function approximation
td learning
reinforcement learning algorithms
model free
evaluation function
temporal difference learning
monte carlo
action selection
state space
function approximators
step size
actor critic
policy evaluation
markov decision processes
temporal difference methods
supervised learning
continuous state
multi agent
machine learning
policy iteration
reinforcement learning methods
approximate dynamic programming