TD3 with Reverse KL Regularizer for Offline Reinforcement Learning from Mixed Datasets.

Published in: ICDM (2022)

Keyphrases