Training llms for divide-and-conquer reasoning elevates test-time scalability, 2026

Xiao Liang, Zhong-Zhi Li, Zhenghao Lin, Eric Hancheng Jiang, Hengyuan Zhang, Yelong Shen, Kai-Wei Chang, Ying Nian Wu, Yeyun Gong, Weizhu Chen · 2026 · arXiv 2602.02477

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

read on arXiv browse 1 citing papers

representative citing papers

Bridging the Detection-to-Abstention Gap in Reasoning Models under Insufficient Information

cs.AI · 2026-05-27 · unverdicted · novelty 5.0

JTS trains reasoning models via supervised warm-up and missing-premise RL to make an explicit answerability commitment that triggers early termination on unanswerable inputs, raising Abstention@Detection near saturation.

citing papers explorer

Showing 1 of 1 citing paper.

Bridging the Detection-to-Abstention Gap in Reasoning Models under Insufficient Information cs.AI · 2026-05-27 · unverdicted · none · ref 22
JTS trains reasoning models via supervised warm-up and missing-premise RL to make an explicit answerability commitment that triggers early termination on unanswerable inputs, raising Abstention@Detection near saturation.

Training llms for divide-and-conquer reasoning elevates test-time scalability, 2026

fields

years

verdicts

representative citing papers

citing papers explorer