Hierarchical Solution of Markov Decision Processes using Macro-actions.

Milos Hauskrecht Nicolas Meuleau Leslie Pack Kaelbling Thomas L. Dean Craig Boutilier

Published in: UAI (1998)

Keyphrases

markov decision processes
macro actions
reinforcement learning
policy iteration
state space
finite state
optimal policy
transition matrices
decision theoretic planning
decision processes
average reward
planning under uncertainty
reinforcement learning algorithms
dynamic programming
action space
infinite horizon
markov decision process
partially observable
average cost
optimal solution
temporally extended
multi agent
machine learning