Self-Augmented Preference Optimization: Off-Policy Paradigms for Language Model Alignment.

Yueqin Yin Zhendong Wang Yujia Xie Weizhu Chen Mingyuan Zhou

Published in: CoRR (2024)

Keyphrases

language model
language modeling
n gram
query expansion
probabilistic model
information retrieval
document retrieval
retrieval model
statistical language models
smoothing methods
ad hoc information retrieval
test collection
mixture model
speech recognition
language modelling
vector space model
relevance model
query terms
language models for information retrieval
language model for information retrieval
context sensitive
user preferences
search engine
pseudo relevance feedback
cross lingual
text classification
word clouds