Parameterized penalties in the dual representation of Markov decision processes.

Fan Ye Enlu Zhou

Published in: CDC (2012)

Keyphrases

markov decision processes
decision theoretic planning
state space
finite state
reinforcement learning
optimal policy
transition matrices
dynamic programming
reachability analysis
policy iteration
decision diagrams
factored mdps
planning under uncertainty
action sets
average reward
model based reinforcement learning
action space
average cost
risk sensitive
state and action spaces
reinforcement learning algorithms
finite horizon
data mining
interval estimation
markov decision process
markov chain
objective function
learning algorithm