AutoBencher: Creating Salient, Novel, Difficult Datasets for Language Models.

Xiang Lisa Li Evan Zheran Liu Percy Liang Tatsunori Hashimoto

Published in: CoRR (2024)

Keyphrases

language model
language modeling
document retrieval
speech recognition
test collection
language modelling
retrieval model
information retrieval
smoothing methods
statistical language models
n gram
probabilistic model
language models for information retrieval
translation model
query expansion
context sensitive
language model for information retrieval
document ranking
passage retrieval
pseudo relevance feedback
text retrieval
relevance model
query specific
vector space model
document length
word error rate
query terms
retrieval systems
decision trees