GPTQT: Quantize Large Language Models Twice to Push the Efficiency.

Yipin Guo Yilin Lang Qinyuan Ren

Published in: CoRR (2024)

Keyphrases

language model
language modeling
n gram
document retrieval
speech recognition
statistical language models
language modelling
probabilistic model
query expansion
information retrieval
retrieval model
ad hoc information retrieval
document ranking
smoothing methods
test collection
context sensitive
query terms
language models for information retrieval
vector space model
pseudo relevance feedback
relevance model
information retrieval systems
document length
word error rate
language model for information retrieval