Thompson sampling for contextual bandits with linear payoffs

Shipra Agrawal, Navin Goyal · 2013

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

representative citing papers

Budget-Constrained Causal Bandits: Bridging Uplift Modeling and Sequential Decision-Making

cs.LG · 2026-04-28 · unverdicted · novelty 6.0

BCCB unifies learning of heterogeneous ad responses, exploration of uncertain users, and budget pacing into a single online process that works effectively from the first user on the Criteo Uplift dataset.

RIE-Greedy: Regularization-Induced Exploration for Contextual Bandits

stat.ML · 2026-03-11 · unverdicted · novelty 5.0

RIE-Greedy uses stochasticity from cross-validation regularization to induce Thompson Sampling-like exploration, claimed equivalent in the two-armed case and empirically competitive in large-scale settings.

citing papers explorer

Showing 2 of 2 citing papers.

Budget-Constrained Causal Bandits: Bridging Uplift Modeling and Sequential Decision-Making cs.LG · 2026-04-28 · unverdicted · none · ref 1
BCCB unifies learning of heterogeneous ad responses, exploration of uncertain users, and budget pacing into a single online process that works effectively from the first user on the Criteo Uplift dataset.
RIE-Greedy: Regularization-Induced Exploration for Contextual Bandits stat.ML · 2026-03-11 · unverdicted · none · ref 6
RIE-Greedy uses stochasticity from cross-validation regularization to induce Thompson Sampling-like exploration, claimed equivalent in the two-armed case and empirically competitive in large-scale settings.

Thompson sampling for contextual bandits with linear payoffs

fields

years

verdicts

representative citing papers

citing papers explorer