Entropy-Regularized Token-Level Policy Optimization for Large Language Models.

Muning Wen Cheng Deng Jun Wang Weinan Zhang Ying Wen

Published in: CoRR (2024)

Keyphrases

language model
language modeling
n gram
language modelling
document retrieval
probabilistic model
document level
query expansion
speech recognition
retrieval model
test collection
information retrieval
context sensitive
language models for information retrieval
statistical language models
relevance model
ad hoc information retrieval
language model for information retrieval
smoothing methods
term dependencies
word error rate
document ranking
translation model
vector space model
cross lingual