Publication: Open-Ended Multi-Modal Relational Reason for Video Question Answering.