Discovering Reinforcement Learning Algorithms.

Junhyuk Oh Matteo Hessel Wojciech M. Czarnecki Zhongwen Xu Hado van Hasselt Satinder Singh David Silver

Published in: NeurIPS (2020)

Keyphrases

reinforcement learning algorithms
reinforcement learning
state space
model free
markov decision processes
reinforcement learning problems
eligibility traces
temporal difference
reinforcement learning methods
learning algorithm
reward function
function approximation
partially observable environments
policy search
stochastic games
reward shaping
dynamic environments
higher order
hidden markov models
training data