Logistic Markov Decision Processes.

Martin Mladenov Craig Boutilier Dale Schuurmans Ofer Meshi Gal Elidan Tyler Lu

Published in: IJCAI (2017)

Keyphrases

markov decision processes
state space
optimal policy
finite state
dynamic programming
reinforcement learning
reachability analysis
partially observable
infinite horizon
average cost
risk sensitive
transition matrices
decision theoretic planning
planning under uncertainty
finite horizon
reinforcement learning algorithms
average reward
action space
policy iteration
factored mdps
model based reinforcement learning
state and action spaces
decision diagrams
action sets
reward function
markov chain