Offline Reinforcement Learning with On-Policy Q-Function Regularization.

Laixi Shi Robert Dadashi Yuejie Chi Pablo Samuel Castro Matthieu Geist

Published in: ECML/PKDD (4) (2023)

Keyphrases