Temporal Difference Learning as Gradient Splitting.

Rui Liu Alex Olshevsky

Published in: CoRR (2020)

Keyphrases

temporal difference learning
function approximation
fixed point
reinforcement learning
evaluation function
game playing
temporal difference
approximate value iteration
markov decision process
reinforcement learning algorithms
monte carlo
markov decision processes
function approximators
dynamical systems
support vector
multi agent
model free
policy iteration
neural network