Dual Transformer Decoder based Features Fusion Network for Automated Audio Captioning.

Published in: INTERSPEECH (2023)

Keyphrases