CacheGen: Fast Context Loading for Language Model Applications.

Yuhan Liu Hanchen Li Kuntai Du Jiayi Yao Yihua Cheng Yuyang Huang Shan Lu Michael Maire Henry Hoffmann Ari Holtzman Ganesh Ananthanarayanan Junchen Jiang

Published in: CoRR (2023)

Keyphrases

language model
context sensitive
language modeling
n gram
document retrieval
information retrieval
probabilistic model
retrieval model
speech recognition
query expansion
language modelling
statistical language models
mixture model
test collection
translation model
language model for information retrieval
query terms
cross lingual
relevance model
query specific
smoothing methods
ad hoc information retrieval
vector space model
context dependent
machine learning
dependency structure
feature selection
document length
word error rate
hidden markov models