Competing Markov decision processes.

Kevin D. Glazebrook

Published in: Ann. Oper. Res. (1991)

Keyphrases

markov decision processes
state space
optimal policy
dynamic programming
transition matrices
reachability analysis
policy iteration
reinforcement learning
finite horizon
factored mdps
average cost
finite state
reinforcement learning algorithms
average reward
action space
decision theoretic planning
partially observable
infinite horizon
markov decision process
planning under uncertainty
risk sensitive
decision processes
action sets
collaborative filtering