Publication: On Gap-dependent Bounds for Offline Reinforcement Learning.