Publication: Deep Episodic Value Iteration for Model-based Meta-Reinforcement Learning.