CLEAN-EVAL: Clean Evaluation on Contaminated Large Language Models.

Wenhong Zhu Hongkun Hao Zhiwei He Yunze Song Yumeng Zhang Hanxu Hu Yiran Wei Rui Wang Hongyuan Lu

Published in: CoRR (2023)

Keyphrases

language model
language modeling
n gram
language modelling
speech recognition
document retrieval
probabilistic model
query expansion
retrieval model
language model for information retrieval
information retrieval
statistical language models
test collection
ad hoc information retrieval
language models for information retrieval
document ranking
context sensitive
query terms
relevance model
passage retrieval
vector space model
smoothing methods
text categorization
image retrieval
statistical language modeling
decision trees
spoken term detection
search engine