Sharpness-Aware Minimization Improves Language Model Generalization.

Dara Bahri Hossein Mobahi Yi Tay

Published in: ACL (1) (2022)

Keyphrases

language model
language modeling
n gram
probabilistic model
document retrieval
speech recognition
retrieval model
language modelling
information retrieval
query expansion
statistical language models
ad hoc information retrieval
mixture model
vector space model
context sensitive
test collection
query terms
language models for information retrieval
relevance model
translation model
document ranking
cross lingual
multiword
statistical machine translation
pseudo feedback