Publication: Deep Primal-Dual Reinforcement Learning: Accelerating Actor-Critic using Bellman Duality.