Markov Decision Processes with Time-Varying Geometric Discounting.

Jiarui Gan Annika Hennes Rupak Majumdar Debmalya Mandal Goran Radanovic

Published in: AAAI (2023)

Keyphrases

markov decision processes
finite state
state space
optimal policy
policy iteration
dynamic programming
transition matrices
reachability analysis
reinforcement learning
reinforcement learning algorithms
decision processes
planning under uncertainty
finite horizon
decision theoretic planning
average cost
average reward
risk sensitive
partially observable
action space
infinite horizon
state and action spaces
action sets
model based reinforcement learning
stochastic shortest path
markov decision process
partially observable markov decision processes
factored mdps
sufficient conditions