A Comprehensive Study of Jailbreak Attack versus Defense for Large Language Models.

Zihao Xu Yi Liu Gelei Deng Yuekang Li Stjepan Picek

Published in: ACL (Findings) (2024)

Keyphrases

language model
defense mechanisms
language modeling
ddos attacks
n gram
document retrieval
language modelling
retrieval model
probabilistic model
speech recognition
test collection
network security
information retrieval
smoothing methods
statistical language models
context sensitive
query expansion
vector space model
query terms
intrusion detection
word error rate
query specific
relevance model
ad hoc information retrieval
document ranking
pseudo relevance feedback
language models for information retrieval
language model for information retrieval