Parameter-Efficient Mixture-of-Experts Architecture for Pre-trained Language Models.

Ze-Feng Gao Peiyu Liu Wayne Xin Zhao Zhong-Yi Lu Ji-Rong Wen

Published in: COLING (2022)

Keyphrases

language model
mixture model
language modeling
pre trained
n gram
document retrieval
probabilistic model
retrieval model
language modelling
query expansion
speech recognition
test collection
information retrieval
statistical language models
smoothing methods
em algorithm
expert finding
document ranking
computer vision