Compressing Context to Enhance Inference Efficiency of Large Language Models.

Yucheng Li Bo Dong Frank Guerin Chenghua Lin

Published in: EMNLP (2023)

Keyphrases

language model
language modeling
context sensitive
probabilistic model
speech recognition
document retrieval
test collection
statistical language models
n gram
query expansion
mixture model
information retrieval
retrieval model
language modelling
vector space model
translation model
query terms
pseudo relevance feedback
language models for information retrieval
image annotation
probabilistic retrieval models
document length
relevance model
bayesian networks