Knowledge is reward: Learning optimal exploration by predictive reward cashing.

Luca Ambrogioni

Published in: CoRR (2021)

Keyphrases

prior knowledge
reinforcement learning
background knowledge
learning algorithm
learning process
initially unknown
policy gradient
dynamic programming
state space
knowledge acquisition
optimal solution
long run
organizational learning
subject matter
knowledge base
acquire knowledge
machine learning