Language Model Unalignment: Parametric Red-Teaming to Expose Hidden Harms and Biases.

Rishabh Bhardwaj Soujanya Poria

Published in: CoRR (2023)

Keyphrases

language model
language modeling
probabilistic model
document retrieval
n gram
speech recognition
test collection
retrieval model
language modelling
information retrieval
query expansion
mixture model
ad hoc information retrieval
statistical language models
smoothing methods
query terms
language model for information retrieval
document ranking
relevance model
word error rate
vector space model
context sensitive
translation model
statistical machine translation
pseudo relevance feedback
document length
language models for information retrieval
retrieval effectiveness