Benchmarking Benchmark Leakage in Large Language Models.

Ruijie Xu Zengzhi Wang Run-Ze Fan Pengfei Liu

Published in: CoRR (2024)

Keyphrases

language model
language modeling
n gram
probabilistic model
speech recognition
document retrieval
language modelling
information retrieval
retrieval model
context sensitive
test collection
query expansion
document ranking
language model for information retrieval
statistical language models
ad hoc information retrieval
query terms
term dependencies
smoothing methods
relevance model
document length
pseudo relevance feedback