Efficient Training of Language Models with Compact and Consistent Next Token Distributions.

Ashutosh Sathe Sunita Sarawagi

Published in: ACL (Findings) (2024)

Keyphrases

language model
language modeling
speech recognition
n gram
probabilistic model
retrieval model
language modelling
statistical language models
test collection
query expansion
information retrieval
smoothing methods
context sensitive
language model for information retrieval
relevance model
training set
search engine
term dependencies
pseudo relevance feedback
word error rate