HaluEval: A Large-Scale Hallucination Evaluation Benchmark for Large Language Models.

Junyi Li Xiaoxue Cheng Wayne Xin Zhao Jian-Yun Nie Ji-Rong Wen

Published in: CoRR (2023)

Keyphrases

language model
language modeling
n gram
speech recognition
statistical language models
probabilistic model
information retrieval
document retrieval
language modelling
document ranking
query expansion
test collection
retrieval model
vector space model
smoothing methods
quantitative evaluation
context sensitive
text mining
language models for information retrieval
relevance model
pseudo relevance feedback
word error rate
ad hoc information retrieval
language model for information retrieval