Tuning continual exploration in reinforcement learning: An optimality property of the Boltzmann strategy.

Published in: Neurocomputing (2008)

Keyphrases