Publication: Reward Conditioned Neural Movement Primitives for Population-Based Variational Policy Optimization.