Correcting Momentum in Temporal Difference Learning.

Emmanuel Bengio Joelle Pineau Doina Precup

Published in: CoRR (2021)

Keyphrases

temporal difference learning
fixed point
function approximation
reinforcement learning
evaluation function
learning rate
game playing
approximate value iteration
temporal difference
markov decision process
reinforcement learning algorithms
monte carlo
state space
function approximators
learning algorithm
markov decision processes