Where-to-unmask: Ground- truth-guided unmasking order learning for masked diffusion language models.arXiv preprint arXiv:2602.09501, 2026

Hikaru Asano, Tadashi Kozuno, Kuniaki Saito, Yukino Baba · 2026 · arXiv 2602.09501

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

The Confidence Shortcut: A Reasoning Failure Mode of Masked Diffusion Models

cs.AI · 2026-05-27 · unverdicted · novelty 6.0

Confidence-based decoding and training in masked diffusion models shortcut long-range dependencies in reasoning, producing errors on complex inputs that random masking avoids.

Decoding in Order-Agnostic Language Models: Chain-Rule Deviation and Uniform Spreading

cs.CL · 2026-05-31 · unverdicted · novelty 5.0

OALMs exhibit order-dependent likelihoods up to 0.49 nats/token and a uniform confidence spread maximizes recoverability, motivating Var(log q_t) as a decoding diagnostic.

citing papers explorer

Showing 2 of 2 citing papers.

The Confidence Shortcut: A Reasoning Failure Mode of Masked Diffusion Models cs.AI · 2026-05-27 · unverdicted · none · ref 2
Confidence-based decoding and training in masked diffusion models shortcut long-range dependencies in reasoning, producing errors on complex inputs that random masking avoids.
Decoding in Order-Agnostic Language Models: Chain-Rule Deviation and Uniform Spreading cs.CL · 2026-05-31 · unverdicted · none · ref 1
OALMs exhibit order-dependent likelihoods up to 0.49 nats/token and a uniform confidence spread maximizes recoverability, motivating Var(log q_t) as a decoding diagnostic.

Where-to-unmask: Ground- truth-guided unmasking order learning for masked diffusion language models.arXiv preprint arXiv:2602.09501, 2026

fields

years

verdicts

representative citing papers

citing papers explorer