Publication: Convex Q-Learning, Part 1: Deterministic Optimal Control.