Self-Supervised Training of Speaker Encoder With Multi-Modal Diverse Positive Pairs.

Published in: IEEE ACM Trans. Audio Speech Lang. Process. (2023)

Keyphrases