Publication: Single-Agent Optimization Through Policy Iteration Using Monte-Carlo Tree Search.