Computational Cost.The primary limitation of our framework is the computational overhead during the training phase

Limitations, Future Works Our work presents a promising direction for self-rewarding V-L models, but has limitations that offer avenues for future research

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

PDCR: Perception-Decomposed Confidence Reward for Vision-Language Reasoning

cs.CL · 2026-05-13 · unverdicted · novelty 6.0

PDCR improves vision-language reasoning by computing separate normalized confidence advantages for perception steps and reasoning steps after unsupervised decomposition.

citing papers explorer

Showing 1 of 1 citing paper.

PDCR: Perception-Decomposed Confidence Reward for Vision-Language Reasoning cs.CL · 2026-05-13 · unverdicted · none · ref 80
PDCR improves vision-language reasoning by computing separate normalized confidence advantages for perception steps and reasoning steps after unsupervised decomposition.

Computational Cost.The primary limitation of our framework is the computational overhead during the training phase

fields

years

verdicts

representative citing papers

citing papers explorer