Constrained Markov Decision Processes with Non-constant Discount Factor.

Héctor Jasso-Fuentes Tomás Prieto-Rumeau

Published in: J. Optim. Theory Appl. (2024)

Keyphrases

markov decision processes
discount factor
optimal policy
average reward
partially observable
finite state
state space
reinforcement learning
policy iteration
markov decision problems
reinforcement learning algorithms
dynamic programming
average cost
decision processes
planning under uncertainty
infinite horizon
finite horizon
decision problems
action space