Self-Supervised Learning of Audio Representations From Audio-Visual Data Using Spatial Alignment.

Published in: IEEE J. Sel. Top. Signal Process. (2022)

Keyphrases