arXiv:2407.00783 (2024) 4

Diffusion models, representation learning: A survey , author= · 2024 · arXiv 2407.00783

5 Pith papers cite this work. Polarity classification is still indexing.

5 Pith papers citing it

representative citing papers

DiffusionBench: On Holistic Evaluation of Diffusion Transformers

cs.CV · 2026-06-23 · conditional · novelty 6.0

NanoGen unifies DiT training on ImageNet and T2I, reveals negative Pearson correlations (-0.377 to -0.580) in method rankings across metrics from 21 models, and motivates DiffusionBench for holistic evaluation.

Backbone-Equated Diffusion OOD via Sparse Internal Snapshots

cs.LG · 2026-05-10 · unverdicted · novelty 6.0

Sparse internal snapshots at canonical low-noise levels from frozen diffusion backbones suffice for competitive out-of-distribution detection without full trajectories or large heads.

Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think

cs.CV · 2024-10-09 · unverdicted · novelty 6.0

Aligning noisy hidden states in diffusion transformers to clean features from pretrained visual encoders speeds up training over 17x and reaches FID 1.42.

Semantic Generative Tuning for Unified Multimodal Models

cs.CV · 2026-05-18 · unverdicted · novelty 5.0 · 2 refs

Semantic Generative Tuning applies segmentation-based generative proxies during post-training to align and improve both understanding and generation in unified multimodal models.

Teacher-Feature Drifting: One-Step Diffusion Distillation with Pretrained Diffusion Representations

cs.CV · 2026-05-08 · unverdicted · novelty 5.0

A simplified one-step diffusion distillation uses pretrained teacher features directly for drifting loss plus a mode coverage term, achieving FID 1.58 on ImageNet-64 and 18.4 on SDXL.

citing papers explorer

Showing 1 of 1 citing paper after filters.

DiffusionBench: On Holistic Evaluation of Diffusion Transformers cs.CV · 2026-06-23 · conditional · none · ref 94
NanoGen unifies DiT training on ImageNet and T2I, reveals negative Pearson correlations (-0.377 to -0.580) in method rankings across metrics from 21 models, and motivates DiffusionBench for holistic evaluation.

arXiv:2407.00783 (2024) 4

fields

years

verdicts

representative citing papers

citing papers explorer