Tableaux for Policy Synthesis for MDPs with PCTL* Constraints.

Peter Baumgartner Sylvie Thiébaux Felipe W. Trevizan

Published in: TABLEAUX (2017)

Keyphrases

optimal policy
markov decision processes
markov decision process
finite horizon
markov decision problems
reinforcement learning
infinite horizon
policy iteration
dynamic programming
average reward
state space
average cost
state and action spaces
policy search
partially observable
constraint satisfaction
modal logic
decision theoretic planning
machine learning