Don't Forget Your Reward Values: Language Model Alignment via Value-based Calibration.

Xin Mao Feng-Lin Li Huimin Xu Wei Zhang Anh Tuan Luu

Published in: CoRR (2024)

Keyphrases

language model
language modeling
n gram
document retrieval
information retrieval
probabilistic model
language modelling
retrieval model
query expansion
context sensitive
speech recognition
statistical language models
language models for information retrieval
test collection
vector space model
word clouds
language model for information retrieval
reinforcement learning
pseudo relevance feedback
mixture model
query terms
smoothing methods
document length
ad hoc information retrieval
maximum likelihood
statistical machine translation
language modeling framework
co occurrence
natural language