Con- ceptattention: Diffusion transformers learn highly inter- pretable features

Gao, D · 2025 · arXiv 2502.04320

6 Pith papers cite this work. Polarity classification is still indexing.

6 Pith papers citing it

read on arXiv browse 6 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

What Concepts Lie Within? Detecting and Suppressing Risky Content in Diffusion Transformers

cs.CV · 2026-05-11 · unverdicted · novelty 7.0

A method using attention head vectors detects and suppresses risky content generation in Diffusion Transformers at inference time.

Unified Safe In-context Image Generation in Multimodal Diffusion Transformers via Restricting Unsafe Information Flows

cs.CV · 2026-06-05 · unverdicted · novelty 6.0

UVR is a training-free framework that uses attention modulation based on identified information flow stages in multimodal DiT attention to erase unsafe semantics in image synthesis and editing at 91% and 77% rates while preserving quality.

TS-Attn: Temporal-wise Separable Attention for Multi-Event Video Generation

cs.CV · 2026-04-21 · unverdicted · novelty 6.0

TS-Attn dynamically separates and rearranges attention in existing text-to-video models to improve temporal consistency and prompt adherence for videos with multiple sequential actions.

The Cow of Rembrandt - Analyzing Artistic Prompt Interpretation in Text-to-Image Models

cs.CV · 2025-07-31 · unverdicted · novelty 6.0

Text-to-image diffusion models exhibit varying degrees of emergent content-style separation in art generation, with content tokens primarily influencing object regions and style tokens affecting backgrounds and textures.

Consistency Regularised Gradient Flows for Inverse Problems

stat.ML · 2026-05-08 · unverdicted · novelty 5.0

A consistency-regularized Euclidean-Wasserstein-2 gradient flow performs joint posterior sampling and prompt optimization in latent space for efficient low-NFE inverse problem solving with diffusion models.

FAIR_XAI: Improving Multimodal Foundation Model Fairness via Explainability for Wellbeing Assessment

cs.AI · 2026-04-26 · unverdicted · novelty 4.0

Vision-language models for wellbeing assessment exhibit dataset-dependent performance and demographic biases, with explainability interventions providing inconsistent fairness gains at potential accuracy costs.

citing papers explorer

Showing 0 of 0 citing papers after filters.

No citing papers match the current filters.

Con- ceptattention: Diffusion transformers learn highly inter- pretable features

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer