Q-Learning Algorithms for Constrained Markov Decision Processes With Randomized Monotone Policies: Application to MIMO Transmission Control.

Published in: IEEE Trans. Signal Process. (2007)

Keyphrases