Compressing Large Language Models by Streamlining the Unimportant Layer.

Xiaodong Chen Yuxuan Hu Jing Zhang

Published in: CoRR (2024)

Keyphrases

language model
language modeling
n gram
probabilistic model
speech recognition
document retrieval
test collection
retrieval model
language modelling
information retrieval
statistical language models
query expansion
ad hoc information retrieval
query terms
smoothing methods
pseudo relevance feedback
document ranking
query specific
vector space model
language model for information retrieval
retrieval effectiveness
passage retrieval
translation model
machine learning