Offline Policy Optimization in RL with Variance Regularizaton.

Riashat Islam Samarth Sinha Homanga Bharadhwaj Samin Yeasar Arnob Zhuoran Yang Animesh Garg Zhaoran Wang Lihong Li Doina Precup

Published in: CoRR (2022)