Learning in Markov Decision Processes under Constraints.

Rahul Singh Abhishek Gupta Ness B. Shroff

Published in: CoRR (2020)

Keyphrases

markov decision processes
reinforcement learning
model based reinforcement learning
learning algorithm
state space
finite state
macro actions
factored mdps
decision theoretic planning
partially observable
optimal policy
real time dynamic programming
reinforcement learning algorithms
data mining
policy iteration
real valued
dynamic programming
multi agent