Uniqueness of optimal policies as a generic property of discounted Markov decision processes: Ekeland's variational principle approach.

Published in: Kybernetika (2016)

Keyphrases