Publication: Efficient CUDA stream management for multi-DNN real-time inference on embedded GPUs.