Bayesian sequential optimal experimental design for nonlinear models using policy gradient reinforcement learning

· 2021 · arXiv 2110.15335

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

read on arXiv browse 3 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

Variational Sequential Optimal Experimental Design using Reinforcement Learning

stat.ML · 2023-06-17 · unverdicted · novelty 7.0

vsOED uses a variational one-point reward and RL policy optimization to provide a lower bound on expected information gain for sequential experimental design, supporting nuisance parameters, implicit likelihoods, and multiple design goals.

Adaptive Sensing beyond Non-Adaptive Information Limits: End-to-End Co-Design of Geometry, Policy, and Inference

physics.optics · 2026-04-28 · unverdicted · novelty 6.0

Joint dynamic programming co-optimizes continuous hardware geometry and Bellman-optimal adaptive policies, yielding large gains over baselines in radar POMDPs, qubit sensors, and 90k-pixel photonic metasensors.

Optimal experimental design: Formulations and computations

stat.ME · 2024-07-23 · unverdicted · novelty 2.0

A systematic survey of optimal experimental design covering criteria formulations, estimation and optimization methods, and emerging sequential design policies.

citing papers explorer

Showing 3 of 3 citing papers.

Variational Sequential Optimal Experimental Design using Reinforcement Learning stat.ML · 2023-06-17 · unverdicted · none · ref 31
vsOED uses a variational one-point reward and RL policy optimization to provide a lower bound on expected information gain for sequential experimental design, supporting nuisance parameters, implicit likelihoods, and multiple design goals.
Adaptive Sensing beyond Non-Adaptive Information Limits: End-to-End Co-Design of Geometry, Policy, and Inference physics.optics · 2026-04-28 · unverdicted · none · ref 34
Joint dynamic programming co-optimizes continuous hardware geometry and Bellman-optimal adaptive policies, yielding large gains over baselines in radar POMDPs, qubit sensors, and 90k-pixel photonic metasensors.
Optimal experimental design: Formulations and computations stat.ME · 2024-07-23 · unverdicted · none · ref 17
A systematic survey of optimal experimental design covering criteria formulations, estimation and optimization methods, and emerging sequential design policies.

Bayesian sequential optimal experimental design for nonlinear models using policy gradient reinforcement learning

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer