Publication: Reinforcement learning using expectation maximization based guided policy search for stochastic dynamics.