RRHF: Rank Responses to Align Language Models with Human Feedback.

Hongyi Yuan Zheng Yuan Chuanqi Tan Wei Wang Songfang Huang Fei Huang

Published in: NeurIPS (2023)

Keyphrases

language model
language modeling
document retrieval
n gram
probabilistic model
speech recognition
information retrieval
language modelling
query expansion
statistical language models
retrieval model
ad hoc information retrieval
smoothing methods
context sensitive
test collection
vector space model
translation model
relevance feedback
language models for information retrieval
cross lingual
probabilistic retrieval models
query specific
document ranking
relevance model
pseudo relevance feedback
text categorization
language model for information retrieval