Exploration Bonus for Regret Minimization in Undiscounted Discrete and Continuous Markov Decision Processes.

Published in: CoRR (2018)

Keyphrases