Jailbreaking Large Language Models Against Moderation Guardrails via Cipher Characters.

Haibo Jin Andy Zhou Joe D. Menke Haohan Wang

Published in: CoRR (2024)

Keyphrases

language model
language modeling
n gram
probabilistic model
information retrieval
retrieval model
query expansion
speech recognition
document retrieval
test collection
vector space model
language modelling
statistical language models
document ranking
translation model
query terms
word error rate
context sensitive
pseudo relevance feedback
language models for information retrieval
optical character recognition
relevance model
language model for information retrieval
passage retrieval
smoothing methods