Publication: Guided Exploration in Reinforcement Learning via Monte Carlo Critic Optimization.