Publication: TreeQN and ATreeC: Differentiable Tree Planning for Deep Reinforcement Learning.