Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models.

Zixiang Chen Yihe Deng Huizhuo Yuan Kaixuan Ji Quanquan Gu

Published in: CoRR (2024)

Keyphrases

language model
fine tuning
language modeling
n gram
speech recognition
information retrieval
probabilistic model
document retrieval
language modelling
context sensitive
retrieval model
query expansion
test collection
statistical language models
query terms
ad hoc information retrieval
vector space model
document ranking
query specific
document length
language model for information retrieval
machine learning
relevance model
smoothing methods
decision trees