Language Model Self-improvement by Reinforcement Learning Contemplation.

Jing-Cheng Pang Pengyuan Wang Kaiyuan Li Xiong-Hui Chen Jiacheng Xu Zongzhang Zhang Yang Yu

Published in: CoRR (2023)

Keyphrases

language model
reinforcement learning
language modeling
speech recognition
information retrieval
document retrieval
n gram
probabilistic model
query expansion
retrieval model
language modelling
statistical language models
mixture model
context sensitive
smoothing methods
test collection
pseudo relevance feedback
ad hoc information retrieval
query terms
vector space model
machine learning
translation model
relevance model
statistical machine translation
retrieval systems
word error rate
feature selection
statistical language modeling
language models for information retrieval
language model for information retrieval