Publication: DeepAveragers: Offline Reinforcement Learning By Solving Derived Non-Parametric MDPs.