On Learning Intrinsic Rewards for Policy Gradient Methods.

Zeyu Zheng Junhyuk Oh Satinder Singh

Published in: NeurIPS (2018)

Keyphrases

learning process
reinforcement learning
learning tasks
policy gradient methods
supervised learning
learning algorithm
learning problems
learning experience
markov decision processes
learning capabilities