Mitigating Off-Policy Bias in Actor-Critic Methods with One-Step Q-learning: A Novel Correction Approach.

Published in: Trans. Mach. Learn. Res. (2024)

Keyphrases