Single Episode Policy Transfer in Reinforcement Learning.

Jiachen Yang Brenden K. Petersen Hongyuan Zha Daniel Faissol

Published in: CoRR (2019)

Keyphrases

reinforcement learning
optimal policy
transfer learning
policy search
markov decision problems
markov decision process
approximate dynamic programming
machine learning
partially observable environments
partially observable
action selection
optimal control
multi agent
neural network
model free
function approximation
policy gradient
active learning
robotic control