On Finding the Maximal Gain for Markov Decision Processes.

Amedeo R. Odoni

Published in: Oper. Res. (1969)

Keyphrases

markov decision processes
state space
finite state
optimal policy
reinforcement learning
policy iteration
transition matrices
dynamic programming
reinforcement learning algorithms
decision theoretic planning
planning under uncertainty
reachability analysis
finite horizon
decision processes
factored mdps
partially observable
model based reinforcement learning
action space
risk sensitive
average reward
infinite horizon
average cost
data mining
markov decision process
state abstraction
state and action spaces
semi markov decision processes