CM-PIE: Cross-modal perception for interactive-enhanced audio-visual video parsing.

Yaru Chen Ruohao Guo Xubo Liu Peipei Wu Guangyao Li Zhenbo Li Wenwu Wang

Published in: CoRR (2023)

Keyphrases