F: discriminative dense fusion of appearance and motion modalities for end-to-end video classification.

Published in: Multim. Tools Appl. (2022)

Keyphrases