Reanalysis of Variance Reduced Temporal Difference Learning.

Tengyu Xu Zhe Wang Yi Zhou Yingbin Liang

Published in: CoRR (2020)

Keyphrases

temporal difference learning
function approximation
fixed point
game playing
evaluation function
reinforcement learning
approximate value iteration
temporal difference
markov decision process
reinforcement learning algorithms
neural network
function approximators
machine learning
monte carlo
graphical models
semi supervised
probabilistic model
decision making