Reinforcement learning for optimization of covid-19 mitigation policies

Kompella, V · 2020 · arXiv 2010.10560

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

representative citing papers

When are LLMs Sufficient Policy Optimizers for Sequential RL Tasks?

cs.LG · 2026-05-29 · unverdicted · novelty 7.0 · 2 refs

PromptPO shows LLMs can act as black-box policy optimizers for sequential RL when leveraging prior knowledge, matching baselines in exploration and robotics but underperforming in MuJoCo.

Optimizing Resource-Constrained Non-Pharmaceutical Interventions for Multi-Cluster Outbreak Control Using Hierarchical Reinforcement Learning

cs.LG · 2026-03-19 · unverdicted · novelty 6.0

Hierarchical RL with a global cost controller and local marginal-value policies outperforms RMAB and heuristic baselines by 20-30% in simulated multi-cluster SARS-CoV-2 control.

A Multi-Agent Reinforcement Learning Framework for Public Health Decision Analysis

cs.AI · 2023-11-01 · unverdicted · novelty 4.0

MARL framework for jurisdiction-specific HIV intervention allocation accounting for cross-jurisdictional interactions outperforms single-agent RL in CA/FL simulations under fixed budgets.

Neetyabhas: A Framework for Uncertainty-Aware Public Policy Optimization in Rational Agent-Based Models

cs.AI · 2026-06-03 · unverdicted · novelty 3.0

A hierarchical RL simulation of agent behaviors and uncertainty-aware policy optimization shows masking and vaccination reduce epidemic peaks and duration.

citing papers explorer

Showing 2 of 2 citing papers after filters.

A Multi-Agent Reinforcement Learning Framework for Public Health Decision Analysis cs.AI · 2023-11-01 · unverdicted · none · ref 4
MARL framework for jurisdiction-specific HIV intervention allocation accounting for cross-jurisdictional interactions outperforms single-agent RL in CA/FL simulations under fixed budgets.
Neetyabhas: A Framework for Uncertainty-Aware Public Policy Optimization in Rational Agent-Based Models cs.AI · 2026-06-03 · unverdicted · none · ref 23
A hierarchical RL simulation of agent behaviors and uncertainty-aware policy optimization shows masking and vaccination reduce epidemic peaks and duration.

Reinforcement learning for optimization of covid-19 mitigation policies

fields

years

verdicts

representative citing papers

citing papers explorer