New prioritized value iteration for Markov decision processes.

Ma. de Guadalupe García-Hernández José Ruiz-Pinales Eva Onaindia Juan Gabriel Aviña-Cervantes Sergio E. Ledesma-Orozco Edgar Alvarado-Mendez Alberto Reyes-Ballesteros

Published in: Artif. Intell. Rev. (2012)

Keyphrases

markov decision processes
policy iteration
finite state
state space
reinforcement learning
dynamic programming
optimal policy
average reward
transition matrices
decision theoretic planning
model based reinforcement learning
infinite horizon
reinforcement learning algorithms
state and action spaces
decision processes
factored mdps
markov decision process
action space
risk sensitive
average cost
planning under uncertainty
reward function
action sets
partially observable
state abstraction
decision diagrams
multistage
machine learning
stochastic shortest path