Proximal Gradient Temporal Difference Learning: Stable Reinforcement Learning with Polynomial Sample Complexity.

Published in: J. Artif. Intell. Res. (2018)

Keyphrases