Planning in entropy-regularized Markov decision processes and games.

Jean-Bastien Grill Omar Darwiche Domingues Pierre Ménard Rémi Munos Michal Valko

Published in: NeurIPS (2019)

Keyphrases