Extending Segment Anything Model into Auditory and Temporal Dimensions for Audio-Visual Segmentation.

Published in: CoRR (2024)

Keyphrases