Scalable Low-Latency Persistent Neural Machine Translation on CPU Server with Multiple FPGAs.

Eriko Nurvitadhi Mishali Naik Andrew Boutros Prerna Budhkar Ali Jafari Dongup Kwon David Sheffield Abirami Prabhakaran Karthik Gururaj Pranavi Appana

Published in: FPT (2019)