Point-Based Policy Iteration.

Shihao Ji Ronald Parr Hui Li Xuejun Liao Lawrence Carin

Published in: AAAI (2007)

Keyphrases

policy iteration
markov decision processes
model free
fixed point
reinforcement learning
optimal policy
least squares
sample path
markov decision process
policy evaluation
finite state
temporal difference
average reward
state space
markov decision problems
convergence rate
infinite horizon
linear programming
multistage
discounted reward
function approximation
dynamic programming