Offline Reinforcement Learning with On-Policy Q-Function Regularization.

Laixi Shi Robert Dadashi Yuejie Chi Pablo Samuel Castro Matthieu Geist

Published in: CoRR (2023)

Keyphrases