Publication: Reward Conditioned Neural Movement Primitives for Population Based Variational Policy Optimization.