Publication: An investigation of time reversal symmetry in reinforcement learning.