OptiDICE: Offline Policy Optimization via Stationary Distribution Correction Estimation.

Published in: CoRR (2021)

Keyphrases