Sample-efficient multi-objective learning via generalized policy improvement prioritization,

· 2023 · arXiv 2301.07784

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Micro-Swarm Locomotion Optimization in Dynamic Flow using Multi-Objective Multi-Agent Reinforcement Learning

cs.RO · 2026-05-24 · unverdicted · novelty 7.0

Hybrid CFD-MOMARL framework with PCGrad enables micro-swarm navigation in pulsatile flow, achieving progress 6.5-7.0, energy 0.63-0.65, smoothness 0.97-0.99 with emergent behaviors.

Sampling-Based Coordination-Informed Multi-Objective Multi-Robot Reinforcement Learning

cs.RO · 2026-06-29 · unverdicted · novelty 5.0

CIMORL framework with sampling variants (TS and MPPI) uses privileged training for decentralized multi-objective multi-robot RL, reporting 21.2% hypervolume gain over baselines in cooperative and adversarial tests.

citing papers explorer

Showing 2 of 2 citing papers.

Micro-Swarm Locomotion Optimization in Dynamic Flow using Multi-Objective Multi-Agent Reinforcement Learning cs.RO · 2026-05-24 · unverdicted · none · ref 54
Hybrid CFD-MOMARL framework with PCGrad enables micro-swarm navigation in pulsatile flow, achieving progress 6.5-7.0, energy 0.63-0.65, smoothness 0.97-0.99 with emergent behaviors.
Sampling-Based Coordination-Informed Multi-Objective Multi-Robot Reinforcement Learning cs.RO · 2026-06-29 · unverdicted · none · ref 12
CIMORL framework with sampling variants (TS and MPPI) uses privileged training for decentralized multi-objective multi-robot RL, reporting 21.2% hypervolume gain over baselines in cooperative and adversarial tests.

Sample-efficient multi-objective learning via generalized policy improvement prioritization,

fields

years

verdicts

representative citing papers

citing papers explorer