Attnlrp: attention-aware layer-wise relevance propagation for transformers

Reduan Achtibat, Sayed Mohammad Vakilzadeh Hatefi, Maximilian Dreyer, Aakriti Jain, Thomas Wiegand, Sebastian Lapuschkin, Wojciech Samek · 2024 · arXiv 2402.05602

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

read on arXiv browse 3 citing papers

representative citing papers

Faithfulness Serum: Mitigating the Faithfulness Gap in Textual Explanations of LLM Decisions via Attribution Guidance

cs.CL · 2026-04-15 · unverdicted · novelty 6.0

A training-free method improves epistemic faithfulness of LLM textual explanations by guiding generation with attribution-based attention interventions.

Saliency-R1: Enforcing Interpretable and Faithful Vision-language Reasoning via Saliency-map Alignment Reward

cs.CV · 2026-04-06 · unverdicted · novelty 6.0

Saliency-R1 uses a novel saliency map technique and GRPO with human bounding-box overlap as reward to improve VLM reasoning faithfulness and interpretability.

Attribution-Guided Continual Learning for Large Language Models

cs.LG · 2026-05-06 · unverdicted · novelty 5.0

An attribution-based continual learning framework for LLMs modulates per-parameter gradients using task-specific importance scores to reduce forgetting of prior tasks.

citing papers explorer

Showing 3 of 3 citing papers.

Faithfulness Serum: Mitigating the Faithfulness Gap in Textual Explanations of LLM Decisions via Attribution Guidance cs.CL · 2026-04-15 · unverdicted · none · ref 1
A training-free method improves epistemic faithfulness of LLM textual explanations by guiding generation with attribution-based attention interventions.
Saliency-R1: Enforcing Interpretable and Faithful Vision-language Reasoning via Saliency-map Alignment Reward cs.CV · 2026-04-06 · unverdicted · none · ref 2
Saliency-R1 uses a novel saliency map technique and GRPO with human bounding-box overlap as reward to improve VLM reasoning faithfulness and interpretability.
Attribution-Guided Continual Learning for Large Language Models cs.LG · 2026-05-06 · unverdicted · none · ref 36
An attribution-based continual learning framework for LLMs modulates per-parameter gradients using task-specific importance scores to reduce forgetting of prior tasks.

Attnlrp: attention-aware layer-wise relevance propagation for transformers

fields

years

verdicts

representative citing papers

citing papers explorer