Reinforcement Learning Generalization with Surprise Minimization.

Jerry Zikun Chen

Published in: CoRR (2020)

Keyphrases

reinforcement learning
objective function
function approximation
model free
state space
temporal difference
machine learning
transfer learning
optimal policy
dynamic programming
learning environment
learning machines
multi agent
real world
reinforcement learning algorithms
stochastic approximation
policy search