Publication: Actor-Critic Reinforcement Learning with Energy-Based Policies.