Off-Policy Correction for Deep Deterministic Policy Gradient Algorithms via Batch Prioritized Experience Replay.

Published in: ICTAI (2021)

Keyphrases