GradSafe: Detecting Unsafe Prompts for LLMs via Safety-Critical Gradient Analysis.

Yueqi Xie Minghong Fang Renjie Pi Neil Zhenqiang Gong

Published in: CoRR (2024)

Keyphrases

safety critical
safety analysis
artificial intelligence
machine learning
user interface
statistical analysis
databases
decision making
monitoring system