One-Counter Markov Decision Processes.

Tomás Brázdil Václav Brozek Kousha Etessami Antonín Kucera Dominik Wojtczak

Published in: SODA (2010)

Keyphrases

markov decision processes
state space
optimal policy
reinforcement learning
finite state
dynamic programming
transition matrices
decision theoretic planning
planning under uncertainty
policy iteration
finite horizon
average reward
average cost
reinforcement learning algorithms
reachability analysis
infinite horizon
decision processes
partially observable
markov decision process
action sets
model based reinforcement learning
risk sensitive
factored mdps
machine learning
state and action spaces
real time dynamic programming