Policy Mirror Descent for Regularized Reinforcement Learning: A Generalized Framework with Linear Convergence.

Published in: CoRR (2021)

Keyphrases