An Online Policy Gradient Algorithm for Markov Decision Processes with Continuous States and Actions.

Published in: Neural Comput. (2016)

Keyphrases