PermLLM: Private Inference of Large Language Models within 3 Seconds under WAN.

Fei Zheng Chaochao Chen Zhongxuan Han Xiaolin Zheng

Published in: CoRR (2024)

Keyphrases

language model
language modeling
probabilistic model
document retrieval
n gram
language modelling
retrieval model
query expansion
speech recognition
ad hoc information retrieval
test collection
information retrieval
mixture model
statistical language models
document ranking
context sensitive
language models for information retrieval
smoothing methods
bayesian networks
pseudo relevance feedback
vector space model
query terms
language model for information retrieval
translation model
relevance model
statistical language modeling