Title resolution pending

· 2021 · arXiv 2406.17092

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

Title metadata for this work has not finished resolving. The hub is built from the citation graph; the title resolver retries DOI and OpenAlex on its next pass.

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

CSO-LLM: Class Subspace Orthogonalization for Post-Training Backdoor Detection and Trigger Inversion in LLMs

cs.CR · 2026-06-30 · unverdicted · novelty 6.0

CSO-LLM proposes class subspace orthogonalization to enhance post-training backdoor detection sensitivity/specificity and enable accurate trigger inversion in LLMs via continuous embedding optimization and discrete greedy accretion.

SCOUT: A Defense Against Data Poisoning Attacks in Fine-Tuned Language Models

cs.CR · 2025-12-10 · unverdicted · novelty 6.0

SCOUT uses token saliency analysis to detect both standard and contextually-plausible backdoor attacks in language models while maintaining clean accuracy.

Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey

cs.CR · 2024-09-26 · unverdicted · novelty 2.0

Survey of harmful fine-tuning attacks on LLMs, their variants, defense strategies, mechanical analysis, and evaluation methodologies.

citing papers explorer

Showing 3 of 3 citing papers.

CSO-LLM: Class Subspace Orthogonalization for Post-Training Backdoor Detection and Trigger Inversion in LLMs cs.CR · 2026-06-30 · unverdicted · none · ref 23
CSO-LLM proposes class subspace orthogonalization to enhance post-training backdoor detection sensitivity/specificity and enable accurate trigger inversion in LLMs via continuous embedding optimization and discrete greedy accretion.
SCOUT: A Defense Against Data Poisoning Attacks in Fine-Tuned Language Models cs.CR · 2025-12-10 · unverdicted · none · ref 23
SCOUT uses token saliency analysis to detect both standard and contextually-plausible backdoor attacks in language models while maintaining clean accuracy.
Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey cs.CR · 2024-09-26 · unverdicted · none · ref 176
Survey of harmful fine-tuning attacks on LLMs, their variants, defense strategies, mechanical analysis, and evaluation methodologies.

Title resolution pending

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer