Large Language Models Are Involuntary Truth-Tellers: Exploiting Fallacy Failure for Jailbreak Attacks.

Yue Zhou Henry Peng Zou Barbara Di Eugenio Yang Zhang

Published in: CoRR (2024)

Keyphrases

language model
language modeling
n gram
document retrieval
probabilistic model
speech recognition
information retrieval
retrieval model
query expansion
context sensitive
statistical language models
test collection
language modelling
vector space model
language models for information retrieval
smoothing methods
translation model
ad hoc information retrieval
relevance model
document length
document ranking
error rate
language modeling approaches