Policy Mirror Descent for Regularized Reinforcement Learning: A Generalized Framework with Linear Convergence.

Published in: SIAM J. Optim. (2023)

Keyphrases