Robust $\phi$-Divergence MDPs.

Chin Pang Ho Marek Petrik Wolfram Wiesemann

Published in: NeurIPS (2022)

Keyphrases

markov decision processes
reinforcement learning
computer vision
search algorithm
state space
factored mdps
neural network
decision making
robust estimation
initial state