On Convergence of Emphatic Temporal-Difference Learning.

Published in: CoRR (2015)

Keyphrases

temporal difference learning
function approximation
fixed point
reinforcement learning
evaluation function
game playing
approximate value iteration
temporal difference
markov decision process
convergence rate
reinforcement learning algorithms
convergence speed
policy iteration
sufficient conditions
gaussian process