Cross-Modal Attention Consistency for Video-Audio Unsupervised Learning.

Shaobo Min Qi Dai Hongtao Xie Chuang Gan Yongdong Zhang Jingdong Wang

Published in: CoRR (2021)

Keyphrases