Solving Robust MDPs through No-Regret Dynamics.

Etash Kumar Guha

Published in: Trans. Mach. Learn. Res. (2024)

Keyphrases

markov decision processes
semi markov decision processes
reinforcement learning
online learning
factored mdps
lower bound
state space
computationally efficient
loss function
markov decision problems
algebraic decision diagrams
objective function
reward function
factored markov decision processes