Reward Modeling for Mitigating Toxicity in Transformer-based Language Models.

Farshid Faal Ketra Schmitt Jia Yuan Yu

Published in: CoRR (2022)

Keyphrases

language model
language modeling
probabilistic model
n gram
document retrieval
test collection
retrieval model
query expansion
information retrieval
speech recognition
language modelling
ad hoc information retrieval
statistical language models
smoothing methods
context sensitive
statistical language modeling
language models for information retrieval
vector space model
query terms
document ranking
pseudo relevance feedback
translation model
pseudo feedback
word segmentation
okapi bm
cross lingual
language modeling approaches