Learning parametric policies and transition probability models of markov decision processes from data.

Published in: Eur. J. Control (2021)

Keyphrases