Vector-Vector-Matrix Architecture: A Novel Hardware-Aware Framework for Low-Latency Inference in NLP Applications.

Published in: EMNLP (1) (2020)

Keyphrases