The final PCA-reduced dimensionalityh i is set to 32

combines gradient-based correction with generation control · 2015

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Uncovering and Aligning Anomalous Attention Heads to Defend Against NLP Backdoor Attacks

cs.CR · 2025-11-16 · unverdicted · novelty 6.0

Backdoor defense for LLMs detects anomalous attention-head similarity on triggers and applies head-wise alignment via fine-tuning to reduce attack success.

citing papers explorer

Showing 1 of 1 citing paper.

Uncovering and Aligning Anomalous Attention Heads to Defend Against NLP Backdoor Attacks cs.CR · 2025-11-16 · unverdicted · none · ref 7
Backdoor defense for LLMs detects anomalous attention-head similarity on triggers and applies head-wise alignment via fine-tuning to reduce attack success.

The final PCA-reduced dimensionalityh i is set to 32

fields

years

verdicts

representative citing papers

citing papers explorer