Publication: Warm-up Free Policy Optimization: Improved Regret in Linear Markov Decision Processes.