Publication: Invariant Policy Optimization: Towards Stronger Generalization in Reinforcement Learning.