Monitored Markov Decision Processes.

Simone Parisi Montaser Mohammedalamen Alireza Kazemipour Matthew E. Taylor Michael Bowling

Published in: AAMAS (2024)

Keyphrases

markov decision processes
state space
optimal policy
dynamic programming
transition matrices
finite state
reachability analysis
reinforcement learning
reinforcement learning algorithms
model based reinforcement learning
policy iteration
infinite horizon
average cost
partially observable
planning under uncertainty
factored mdps
finite horizon
action space
risk sensitive
decision processes
state and action spaces
reward function
markov decision process
average reward
state abstraction
heuristic search