Publication: Temporal Graph Traversals Using Reinforcement Learning With Proximal Policy Optimization.