HyperRouter: Towards Efficient Training and Inference of Sparse Mixture of Experts.

Truong Do Le Khiem Quang Pham TrungTin Nguyen Thanh-Nam Doan Binh Nguyen Chenghao Liu Savitha Ramasamy Xiaoli Li Steven C. H. Hoi

Published in: EMNLP (2023)

Keyphrases