Verification of Markov Decision Processes with Risk-Sensitive Measures.

Murat Cubuktepe Ufuk Topcu

Published in: CoRR (2018)

Keyphrases

risk sensitive
markov decision processes
state space
policy iteration
finite state
optimal policy
reinforcement learning
planning under uncertainty
optimal control
dynamic programming
average reward
finite horizon
reinforcement learning algorithms
utility function
infinite horizon
decision processes
average cost
partially observable
reward function
action space
sufficient conditions
model free
long run
model checking
control policies
machine learning