ALaRM: Align Language Models via Hierarchical Rewards Modeling.

Yuhang Lai Siyuan Wang Shujun Liu Xuanjing Huang Zhongyu Wei

Published in: CoRR (2024)

Keyphrases

language model
language modeling
probabilistic model
n gram
query expansion
retrieval model
document retrieval
language modelling
test collection
speech recognition
information retrieval
statistical language models
language models for information retrieval
context sensitive
vector space model
statistical language modeling
ad hoc information retrieval
document ranking
okapi bm
pseudo relevance feedback
smoothing methods
relevance model
query terms
document length
term dependencies
translation model
error rate
language model for information retrieval