Beyond Benchmarking: A New Paradigm for Evaluation and Assessment of Large Language Models.

Jin Liu Qingquan Li Wenlong Du

Published in: CoRR (2024)

Keyphrases

language model
language modeling
n gram
probabilistic model
speech recognition
document retrieval
ad hoc information retrieval
language modelling
information retrieval
query expansion
retrieval model
language models for information retrieval
statistical language models
language model for information retrieval
smoothing methods
document ranking
query terms
test collection
okapi bm
information extraction
query specific
term dependencies
tf idf
word error rate
cross lingual