Speech Guided Masked Image Modeling for Visually Grounded Speech.

Jongbhin Woo Hyeonggon Ryu Arda Senocak Joon Son Chung

Published in: ICASSP (2024)

Keyphrases