Publication: Identification of optimal policies in Markov decision processes.