Publication: A Routing Optimization Policy Using Graph Convolution Deep Reinforcement Learning.