Jailbreak Attacks and Defenses Against Large Language Models: A Survey.

Sibo Yi Yule Liu Zhen Sun Tianshuo Cong Xinlei He Jiaxing Song Ke Xu Qi Li

Published in: CoRR (2024)

Keyphrases