A simultaneous perturbation stochastic approximation-based actor-critic algorithm for Markov decision processes.

Published in: IEEE Trans. Autom. Control. (2004)

Keyphrases