SmartMoE: Efficiently Training Sparsely-Activated Models through Combining Offline and Online Parallelization.

Published in: USENIX Annual Technical Conference (2023)

Keyphrases