Deep Reinforcement Learning with Robust and Smooth Policy.

Qianli Shen Yan Li Haoming Jiang Zhaoran Wang Tuo Zhao

Published in: ICML (2020)

Keyphrases

reinforcement learning
optimal policy
markov decision process
policy search
state space
function approximation
multi agent
partially observable
learning algorithm
approximate dynamic programming
markov decision processes
action selection
reinforcement learning algorithms
reinforcement learning problems
data sets
policy gradient
infinite horizon
robust estimation
decision making
machine learning
neural network