Asynchronous Policy Evaluation in Distributed Reinforcement Learning over Networks.

Xingyu Sha Jiaqi Zhang Kaiqing Zhang Keyou You Tamer Basar

Published in: CoRR (2020)

Keyphrases

policy evaluation
reinforcement learning
temporal difference
least squares
model free
function approximation
monte carlo
policy iteration
markov decision processes
multi agent
td learning
variance reduction
optimal policy
semi parametric
state space
evaluation function
statistical inference
action selection
neural network
reinforcement learning algorithms
partially observable markov decision processes
transfer learning