Discerning Temporal Difference Learning.

Published in: CoRR (2023)

Keyphrases

temporal difference learning
function approximation
fixed point
evaluation function
game playing
reinforcement learning
temporal difference
approximate value iteration
markov decision process
reinforcement learning algorithms
monte carlo
function approximators
markov decision processes
markov chain
supervised learning
pairwise
learning algorithm