Cross-modal collaborative feature representation via Transformer-based multimodal mixers for RGB-T crowd counting.

Published in: Expert Syst. Appl. (2024)

Keyphrases