Scalable diffusion models with transformers

William Peebles, Saining Xie

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

representative citing papers

ETCHR: Editing To Clarify and Harness Reasoning

cs.CV · 2026-05-22 · unverdicted · novelty 7.0

A decoupled question-conditioned image editor trained via supervised imitation then VLM-reward enhancement improves MLLM visual reasoning Pass@1 by 4.6-5.5 points across models and tasks.

CSF: Black-box Fingerprinting via Compositional Semantics for Text-to-Image Models

cs.CR · 2026-03-20 · unverdicted · novelty 7.0

CSF is the first black-box method to attribute fine-tuned text-to-image models to original lineages via compositional semantic probes and Bayesian decisions across multiple model families.

citing papers explorer

Showing 2 of 2 citing papers.

ETCHR: Editing To Clarify and Harness Reasoning cs.CV · 2026-05-22 · unverdicted · none · ref 24
A decoupled question-conditioned image editor trained via supervised imitation then VLM-reward enhancement improves MLLM visual reasoning Pass@1 by 4.6-5.5 points across models and tasks.
CSF: Black-box Fingerprinting via Compositional Semantics for Text-to-Image Models cs.CR · 2026-03-20 · unverdicted · none · ref 34
CSF is the first black-box method to attribute fine-tuned text-to-image models to original lineages via compositional semantic probes and Bayesian decisions across multiple model families.

Scalable diffusion models with transformers

fields

years

verdicts

representative citing papers

citing papers explorer