PROTO: Iterative Policy Regularized Offline-to-Online Reinforcement Learning.

Jianxiong Li Xiao Hu Haoran Xu Jingjing Liu Xianyuan Zhan Ya-Qin Zhang

Published in: CoRR (2023)

Keyphrases