and Ryu, E

Jongmin Lee, Ernest Ryu · 2025 · arXiv 2510.18340

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

read on arXiv browse 2 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

Policy Gradient for Continuous-Time Robust Markov Decision Processes

cs.LG · 2026-06-03 · unverdicted · novelty 7.0

Extends robust MDPs to continuous time with policy gradient derivations using differential equation methods and proposes optimizers achieving linear convergence and specific sample complexities.

Natural Policy Gradient as Doubly Smoothed Policy Iteration: A Bellman-Operator Framework

cs.LG · 2026-05-11 · unverdicted · novelty 7.0

Natural policy gradient is a special case of doubly smoothed policy iteration that achieves distribution-free global geometric convergence to an epsilon-optimal policy in O((1-gamma)^{-1} log((1-gamma)^{-1} epsilon^{-1})) iterations.

citing papers explorer

Showing 2 of 2 citing papers.

Policy Gradient for Continuous-Time Robust Markov Decision Processes cs.LG · 2026-06-03 · unverdicted · none · ref 18
Extends robust MDPs to continuous time with policy gradient derivations using differential equation methods and proposes optimizers achieving linear convergence and specific sample complexities.
Natural Policy Gradient as Doubly Smoothed Policy Iteration: A Bellman-Operator Framework cs.LG · 2026-05-11 · unverdicted · none · ref 28
Natural policy gradient is a special case of doubly smoothed policy iteration that achieves distribution-free global geometric convergence to an epsilon-optimal policy in O((1-gamma)^{-1} log((1-gamma)^{-1} epsilon^{-1})) iterations.

and Ryu, E

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer