Policy gradient stochastic approximation algorithms for adaptive control of constrained time varying Markov decision processes.

Published in: CDC (2003)

Keyphrases