Privately Aligning Language Models with Reinforcement Learning.

Fan Wu Huseyin A. Inan Arturs Backurs Varun Chandrasekaran Janardhan Kulkarni Robert Sim

Published in: ICLR (2024)

Keyphrases

language model
reinforcement learning
language modeling
n gram
speech recognition
probabilistic model
retrieval model
document retrieval
query expansion
statistical language models
language modelling
information retrieval
test collection
ad hoc information retrieval
language models for information retrieval
machine learning
context sensitive
pseudo relevance feedback
translation model
learning algorithm
query terms
word error rate
language model for information retrieval
text categorization