Dynamics of Temporal Difference Reinforcement Learning.

Blake Bordelon Paul Masset Henry Kuo Cengiz Pehlevan

Published in: CoRR (2023)

Keyphrases

temporal difference
reinforcement learning
function approximation
td learning
model free
reinforcement learning algorithms
evaluation function
temporal difference learning
policy evaluation
monte carlo
action selection
step size
temporal difference methods
actor critic
dynamical systems
state space
function approximators
policy iteration
markov decision processes
optimal policy
action space
multi agent
transfer learning
partially observable
dynamic programming
approximate dynamic programming
decision trees
reinforcement learning problems
machine learning
data mining