HERO: HiErarchical spatio-tempoRal reasOning with Contrastive Action Correspondence for End-to-End Video Object Grounding.

Mengze Li Tianbao Wang Haoyu Zhang Shengyu Zhang Zhou Zhao Wenqiao Zhang Jiaxu Miao Shiliang Pu Fei Wu

Published in: ACM Multimedia (2022)

Keyphrases