Bounded Parameter Markov Decision Processes.

Robert Givan Sonia M. Leach Thomas L. Dean

Published in: ECP (1997)

Keyphrases

markov decision processes
optimal policy
reinforcement learning
finite state
transition matrices
policy iteration
dynamic programming
finite horizon
state space
partially observable
action space
decision theoretic planning
planning under uncertainty
reinforcement learning algorithms
decision processes
factored mdps
state and action spaces
sufficient conditions
average reward
risk sensitive
infinite horizon
action sets
model based reinforcement learning
markov decision process
reward function
learning algorithm