Policy gradient in Lipschitz Markov Decision Processes.

Matteo Pirotta Marcello Restelli Luca Bascetta

Published in: Mach. Learn. (2015)

Keyphrases