Text embedding is not all you need: Attention control for text-to-image semantic alignment with text self-attention maps.arXiv preprint arXiv:2411.15236, 2024

Jeeyung Kim, Erfan Esmaeili, Qiang Qiu · 2024 · arXiv 2411.15236

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

DetailAnywhere: Fashion Detail Generation via Cross-Modal Feature Alignment Distillation

cs.CV · 2026-07-02 · unverdicted · novelty 6.0

Formalizes Fashion Detail Generation task, releases FDBench benchmark with 40K+ pairs, and proposes CFAD distillation method plus RL consistency reward that outperforms open-source baselines.

citing papers explorer

Showing 1 of 1 citing paper.

DetailAnywhere: Fashion Detail Generation via Cross-Modal Feature Alignment Distillation cs.CV · 2026-07-02 · unverdicted · none · ref 66
Formalizes Fashion Detail Generation task, releases FDBench benchmark with 40K+ pairs, and proposes CFAD distillation method plus RL consistency reward that outperforms open-source baselines.

Text embedding is not all you need: Attention control for text-to-image semantic alignment with text self-attention maps.arXiv preprint arXiv:2411.15236, 2024

fields

years

verdicts

representative citing papers

citing papers explorer