A Minimax Learning Approach to Off-Policy Evaluation in Confounded Partially Observable Markov Decision Processes.

Published in: ICML (2022)

Keyphrases