Robust Prompt Optimization for Defending Language Models Against Jailbreaking Attacks.

Andy Zhou Bo Li Haohan Wang

Published in: CoRR (2024)

Keyphrases

language model
language modeling
document retrieval
n gram
probabilistic model
retrieval model
speech recognition
test collection
information retrieval
language modelling
context sensitive
statistical language models
pseudo relevance feedback
query expansion
ddos attacks
language models for information retrieval
relevance model
vector space model
ad hoc information retrieval
smoothing methods
term dependencies
language model for information retrieval
text categorization
okapi bm
document length
query terms
visual features