RUPBench: Benchmarking Reasoning Under Perturbations for Robustness Evaluation in Large Language Models.

Yuqing Wang Yun Zhao

Published in: CoRR (2024)

Keyphrases

language model
language modeling
n gram
document retrieval
probabilistic model
information retrieval
query expansion
speech recognition
statistical language models
language modelling
test collection
retrieval model
query terms
language model for information retrieval
relevance model
smoothing methods
ad hoc information retrieval
context sensitive
document ranking
document length
xml retrieval
translation model
pseudo relevance feedback
vector space model
okapi bm
language models for information retrieval