Supported Policy Optimization for Offline Reinforcement Learning.

Jialong Wu Haixu Wu Zihan Qiu Jianmin Wang Mingsheng Long

Published in: NeurIPS (2022)

Keyphrases