Arbitrarily modulated Markov decision processes.

Jia Yuan Yu Shie Mannor

Published in: CDC (2009)

Keyphrases

markov decision processes
optimal policy
finite state
state space
dynamic programming
reinforcement learning
transition matrices
policy iteration
finite horizon
decision theoretic planning
average cost
partially observable
reward function
reinforcement learning algorithms
reachability analysis
risk sensitive
factored mdps
infinite horizon
model based reinforcement learning
total reward
decision processes
markov decision process
state and action spaces
action sets
average reward
action space