CoMPS: Continual Meta Policy Search.

Glen Berseth Zhiwei Zhang Grace Zhang Chelsea Finn Sergey Levine

Published in: ICLR (2022)

Keyphrases

policy search
reinforcement learning
continuous state
dynamic programming
continuous action
reinforcement learning algorithms
reward function
computational complexity
robot navigation
partially observable markov decision processes
markov decision problems
policy gradient
decision makers
markov chain
action selection