Sudo: Enhancing text-to- image diffusion models with self-supervised direct preference optimization.arXiv preprint arXiv:2504.14534,

Liang Peng, Boxi Wu, Haoran Cheng, Yibo Zhao, Xiaofei He · 2025 · arXiv 2504.14534

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Pave-GRPO: Beyond Instantaneous Guidance through Principled Average Velocity Decomposition

cs.CV · 2026-06-01 · unverdicted · novelty 6.0

Pave-GRPO reformulates GRPO via principled average velocity decomposition to enable denser temporal supervision in flow-based generative model alignment without increasing rollout cost.

AdaGRPO: A Capability-Aware Adaptive Enhancement for Flow-based GRPO

cs.CV · 2026-06-05 · unverdicted · novelty 5.0

AdaGRPO enhances GRPO for flow models via online curriculum filtering of prompts and cross-level advantage fusion, yielding performance gains and training stability.

citing papers explorer

Showing 2 of 2 citing papers.

Pave-GRPO: Beyond Instantaneous Guidance through Principled Average Velocity Decomposition cs.CV · 2026-06-01 · unverdicted · none · ref 13
Pave-GRPO reformulates GRPO via principled average velocity decomposition to enable denser temporal supervision in flow-based generative model alignment without increasing rollout cost.
AdaGRPO: A Capability-Aware Adaptive Enhancement for Flow-based GRPO cs.CV · 2026-06-05 · unverdicted · none · ref 14
AdaGRPO enhances GRPO for flow models via online curriculum filtering of prompts and cross-level advantage fusion, yielding performance gains and training stability.

Sudo: Enhancing text-to- image diffusion models with self-supervised direct preference optimization.arXiv preprint arXiv:2504.14534,

fields

years

verdicts

representative citing papers

citing papers explorer