Rrd: Recursive rubric decomposition for scalable reward modeling

Yifan Shen, Xiang Li, Wei Zhang, Yang Liu · 2026 · arXiv 2601.05743

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

AutoRubric-T2I: Robust Rule-Based Reward Model for Text-to-Image Alignment

cs.AI · 2026-05-17 · unverdicted · novelty 7.0 · 2 refs

AutoRubric-T2I learns and selects explicit rubrics from preference pairs to guide VLM judges, producing high-quality interpretable rewards for T2I alignment with far less data than traditional Bradley-Terry models.

Anomalous Localization and Mobility Edges in Non-Hermitian Quasicrystals with Disordered Imaginary Gauge Fields

cond-mat.dis-nn · 2026-01-21 · unverdicted · novelty 7.0

In a non-Hermitian quasicrystal with disordered imaginary gauge fields, an anomalous transition separates erratic skin-effect states from Anderson-localized states, accompanied by a mobility edge and winding-dependent dynamics.

citing papers explorer

Showing 2 of 2 citing papers.

AutoRubric-T2I: Robust Rule-Based Reward Model for Text-to-Image Alignment cs.AI · 2026-05-17 · unverdicted · none · ref 23 · 2 links
AutoRubric-T2I learns and selects explicit rubrics from preference pairs to guide VLM judges, producing high-quality interpretable rewards for T2I alignment with far less data than traditional Bradley-Terry models.
Anomalous Localization and Mobility Edges in Non-Hermitian Quasicrystals with Disordered Imaginary Gauge Fields cond-mat.dis-nn · 2026-01-21 · unverdicted · none · ref 10
In a non-Hermitian quasicrystal with disordered imaginary gauge fields, an anomalous transition separates erratic skin-effect states from Anderson-localized states, accompanied by a mobility edge and winding-dependent dynamics.

Rrd: Recursive rubric decomposition for scalable reward modeling

fields

years

verdicts

representative citing papers

citing papers explorer