PP-PG: Combining Parameter Perturbation with Policy Gradient Methods for Effective and Efficient Explorations in Deep Reinforcement Learning.

Published in: ACM Trans. Intell. Syst. Technol. (2021)

Keyphrases