Efficient Large Scale Language Modeling with Mixtures of Experts.

Mikel Artetxe Shruti Bhosale Naman Goyal Todor Mihaylov Myle Ott Sam Shleifer Xi Victoria Lin Jingfei Du Srinivasan Iyer Ramakanth Pasunuru Giridharan Anantharaman Xian Li Shuohui Chen Halil Akin Mandeep Baines Louis Martin Xing Zhou Punit Singh Koura Brian O'Horo Jeffrey Wang Luke Zettlemoyer Mona T. Diab Zornitsa Kozareva Veselin Stoyanov

Published in: EMNLP (2022)

Keyphrases