Publication: Optimizing Policy via Deep Reinforcement Learning for Dialogue Management.