Policy Iteration for Factored MDPs.

Daphne Koller Ronald Parr

Published in: UAI (2000)

Keyphrases

factored mdps
policy iteration
markov decision processes
model free
fixed point
optimal policy
reinforcement learning
least squares
temporal difference
approximate dynamic programming
markov decision process
finite state
infinite horizon
state space
convergence rate
linear programming
markov decision problems
dynamic programming
optimal control
decision processes
reinforcement learning algorithms
partially observable
planning under uncertainty
evaluation function
graphical models
cost function