Publication: Online Learning in Markov Decision Processes with Continuous Actions.