Open-Vocabulary Audio-Visual Semantic Segmentation.

Ruohao Guo Liao Qu Dantong Niu Yanyu Qi Wenzhen Yue Ji Shi Bowei Xing Xianghua Ying

Published in: CoRR (2024)

Keyphrases

audio visual
semantic segmentation
multi modal
superpixels
conditional random fields
visual information
weakly supervised
scene classification
visual data
object categories
object classes
multimedia
keywords
principal component analysis
high dimensional
contextual information
information retrieval
image set
multiscale
three dimensional