Runtime Monitoring for Markov Decision Processes.

Sebastian Junges Hazem Torfah Sanjit A. Seshia

Published in: CoRR (2021)

Keyphrases

markov decision processes
optimal policy
finite state
reinforcement learning
transition matrices
state space
dynamic programming
policy iteration
decision theoretic planning
finite horizon
partially observable
reinforcement learning algorithms
factored mdps
reachability analysis
model based reinforcement learning
average cost
markov decision process
average reward
planning under uncertainty
infinite horizon
action space
decision processes
machine learning
real time dynamic programming
partially observable markov decision processes
reward function
multistage
objective function
learning algorithm