Reinforcement learning for optimal execution when liquidity is time-varying

Tommaso Macrì, Fabrizio Lillo · 2024 · arXiv 2402.12049

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

TT-DAC-PS: Twin-Target Deterministic Actor-Critic with Policy Smoothing for Optimal Trade Execution

cs.AI · 2026-06-07 · unverdicted · novelty 4.0

TT-DAC-PS, an enhanced version of TD3, achieves lower mean implementation shortfall than PPO, SAC, A2C, TWAP, VWAP, and AC on LOB data from ten U.S. stocks.

citing papers explorer

Showing 1 of 1 citing paper after filters.

TT-DAC-PS: Twin-Target Deterministic Actor-Critic with Policy Smoothing for Optimal Trade Execution cs.AI · 2026-06-07 · unverdicted · none · ref 12
TT-DAC-PS, an enhanced version of TD3, achieves lower mean implementation shortfall than PPO, SAC, A2C, TWAP, VWAP, and AC on LOB data from ten U.S. stocks.

Reinforcement learning for optimal execution when liquidity is time-varying

fields

years

verdicts

representative citing papers

citing papers explorer