Publication: Air combat maneuver decision based on deep reinforcement learning with auxiliary reward.