Beyond Markov Decision Process with Scalar Markovian Rewards.

Published in: SOCS (2022)

Keyphrases

markov decision process
markov decision processes
reinforcement learning
reward function
state space
optimal policy
finite horizon
transition matrices
temporal difference learning
infinite horizon
finite state
policy iteration
dynamic programming
initial state
multi agent
multiple agents
partial observability
reward shaping
computational complexity
reinforcement learning algorithms
average cost
model free
transition probabilities
decision problems
random walk