Cautious Policy Programming: Exploiting KL Regularization in Monotonic Policy Improvement for Reinforcement Learning.

Published in: CoRR (2021)

Keyphrases