Future-Dependent Value-Based Off-Policy Evaluation in POMDPs.

Masatoshi Uehara Haruka Kiyohara Andrew Bennett Victor Chernozhukov Nan Jiang Nathan Kallus Chengchun Shi Wen Sun

Published in: NeurIPS (2023)