Graph-Reward- SQL : Execution-Free Reinforcement Learning for Text-to- SQL via Graph Matching and Stepwise Reward

Weng, Han, Wu, Puzhen, Longjie, Cui, Zhan, Yi, Liu, Boyi, Song, Yuanfeng · 2025 · DOI 10.18653/v1/2025.findings-emnlp.694

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

open at publisher browse 2 citing papers

representative citing papers

CAPER: Clause-Aligned Process Supervision for Text-to-SQL

cs.DB · 2026-06-02 · unverdicted · novelty 7.0

CAPER derives clause-aligned supervision via SQL AST counterfactuals to train a Clause-PRM that improves execution accuracy up to 15.3% relative and failure localization to 84.53% accuracy on BIRD and Spider.

EXPO-SQL: Execution-based Clause-level Policy Optimization for Text-to-SQL

cs.CL · 2026-04-29 · unverdicted · novelty 7.0

EXPO-SQL improves Text-to-SQL by using clause-level rewards derived from execution error messages and incremental clause execution instead of uniform query-level rewards.

citing papers explorer

Showing 2 of 2 citing papers.

CAPER: Clause-Aligned Process Supervision for Text-to-SQL cs.DB · 2026-06-02 · unverdicted · none · ref 31
CAPER derives clause-aligned supervision via SQL AST counterfactuals to train a Clause-PRM that improves execution accuracy up to 15.3% relative and failure localization to 84.53% accuracy on BIRD and Spider.
EXPO-SQL: Execution-based Clause-level Policy Optimization for Text-to-SQL cs.CL · 2026-04-29 · unverdicted · none · ref 47
EXPO-SQL improves Text-to-SQL by using clause-level rewards derived from execution error messages and incremental clause execution instead of uniform query-level rewards.

Graph-Reward- SQL : Execution-Free Reinforcement Learning for Text-to- SQL via Graph Matching and Stepwise Reward

fields

years

verdicts

representative citing papers

citing papers explorer