Publication: DeepAveragers: Offline Reinforcement Learning by Solving Derived Non-Parametric MDPs.