Self-Tuning Deep Reinforcement Learning.

Tom Zahavy Zhongwen Xu Vivek Veeriah Matteo Hessel Junhyuk Oh Hado van Hasselt David Silver Satinder Singh

Published in: CoRR (2020)

Keyphrases

reinforcement learning
function approximation
reinforcement learning algorithms
markov decision processes
state space
model free
multi agent reinforcement learning
optimal control
control problems
temporal difference
optimal policy
dynamic programming
search algorithm
machine learning
monte carlo
real robot
deep learning
function approximators
temporal difference learning
multi agent
robotic control