End-to-end Audio Visual Scene-aware Dialog Using Multimodal Attention-based Video Features.

Chiori Hori Huda AlAmri Jue Wang Gordon Wichern Takaaki Hori Anoop Cherian Tim K. Marks Vincent Cartillier Raphael Gontijo Lopes Abhishek Das Irfan Essa Dhruv Batra Devi Parikh

Published in: ICASSP (2019)