The Distributional Hypothesis Does Not Fully Explain the Benefits of Masked Language Model Pretraining.

Ting-Rui Chiang Dani Yogatama

Published in: CoRR (2023)

Keyphrases

language model
language modeling
document retrieval
n gram
probabilistic model
speech recognition
language modelling
query expansion
information retrieval
test collection
retrieval model
statistical language models
ad hoc information retrieval
context sensitive
language model for information retrieval
relevance model
query terms
co occurrence
language models for information retrieval
pseudo relevance feedback
translation model
query specific
smoothing methods
vector space model
document length
document ranking
mixture model