Self-Play Preference Optimization for Language Model Alignment.

Yue Wu Zhiqing Sun Huizhuo Yuan Kaixuan Ji Yiming Yang Quanquan Gu

Published in: CoRR (2024)

Keyphrases

language model
language modeling
n gram
probabilistic model
document retrieval
information retrieval
language modelling
context sensitive
query expansion
speech recognition
test collection
smoothing methods
ad hoc information retrieval
vector space model
relevance model
retrieval model
statistical language models
document ranking
language model for information retrieval
user preferences
web search
mixture model
translation model
document length
machine learning
dirichlet prior
query terms
language models for information retrieval