Multi-agent actor-critic for mixed cooperative-competitive environments

· 2017 · arXiv 1706.02275

9 Pith papers cite this work. Polarity classification is still indexing.

9 Pith papers citing it

read on arXiv browse 9 citing papers

citation-role summary

background 1 baseline 1

citation-polarity summary

background 1 baseline 1

representative citing papers

Quantum Advantage in Multi Agent Reinforcement Learning

cs.LG · 2026-05-14 · conditional · novelty 6.0

Entangled QMARL agents approach the Tsirelson bound of 0.854 in CHSH while unentangled versions match classical baselines, and hybrid quantum-classical setups outperform both in CoopNav.

Scalable Neighborhood-Based Multi-Agent Actor-Critic

cs.LG · 2026-04-20 · unverdicted · novelty 6.0

MADDPG-K scales centralized critics in multi-agent RL by limiting each critic to k-nearest neighbors under Euclidean distance, yielding constant input size and competitive performance.

Overcoming Environmental Meta-Stationarity in MARL via Adaptive Curriculum and Counterfactual Group Advantage

cs.AI · 2025-06-09 · unverdicted · novelty 6.0

CL-MARL uses an adaptive curriculum scheduler called FlexDiff and Counterfactual Group Relative Policy Advantage to break static-difficulty training in MARL and achieve higher win rates on hard StarCraft maps.

Asynchronous Cooperative Multi-Agent Reinforcement Learning with Limited Communication

cs.MA · 2025-02-01 · unverdicted · novelty 6.0

AsynCoMARL is a new asynchronous MARL algorithm that matches leading baselines on success and collision rates while using 26% fewer messages via graph transformers on dynamic communication graphs.

Coordination Architecture Shapes Continuous Demand Response Outcomes in Building Districts

eess.SY · 2026-05-02 · unverdicted · novelty 5.0

In a 25-building district simulation, the hybrid MPC-SAC architecture delivered the strongest balance of load tracking accuracy (4.8% NMBE), thermal comfort (16.8% exceedance), and lowest spatial variability compared to centralized MPC, decentralized SAC, MAPPO, and rule-based control.

A Communication-Efficient Multi-Agent Actor-Critic Algorithm for Distributed Reinforcement Learning

cs.LG · 2019-07-06 · unverdicted · novelty 4.0

A communication-efficient multi-agent actor-critic algorithm solves distributed RL on strongly connected directed graphs by transmitting only two scalar values per communication step.

Built Environment Reasoning from Remote Sensing Imagery Using Large Vision--Language Models

cs.CL · 2026-05-08 · unverdicted · novelty 3.0

Large vision-language models applied to multi-scale remote sensing imagery can generate recommendations on built environment design, constructability, land use, and risks for smart city decision-making.

Topology-Driven Anti-Entanglement Control for Soft Robots

cs.RO · 2026-05-01 · unverdicted · novelty 3.0

TD-MARL uses shared topological states and invariants to coordinate soft robots and reduce entanglement risk, outperforming standard DRL in simulated convergence and anti-winding performance.

A Distributionally Robust Reinforcement Learning Framework for Constrained Urban EV Dispatch

cs.AI · 2026-04-28

citing papers explorer

Showing 9 of 9 citing papers.

Quantum Advantage in Multi Agent Reinforcement Learning cs.LG · 2026-05-14 · conditional · none · ref 4
Entangled QMARL agents approach the Tsirelson bound of 0.854 in CHSH while unentangled versions match classical baselines, and hybrid quantum-classical setups outperform both in CoopNav.
Scalable Neighborhood-Based Multi-Agent Actor-Critic cs.LG · 2026-04-20 · unverdicted · none · ref 7
MADDPG-K scales centralized critics in multi-agent RL by limiting each critic to k-nearest neighbors under Euclidean distance, yielding constant input size and competitive performance.
Overcoming Environmental Meta-Stationarity in MARL via Adaptive Curriculum and Counterfactual Group Advantage cs.AI · 2025-06-09 · unverdicted · none · ref 56
CL-MARL uses an adaptive curriculum scheduler called FlexDiff and Counterfactual Group Relative Policy Advantage to break static-difficulty training in MARL and achieve higher win rates on hard StarCraft maps.
Asynchronous Cooperative Multi-Agent Reinforcement Learning with Limited Communication cs.MA · 2025-02-01 · unverdicted · none · ref 26
AsynCoMARL is a new asynchronous MARL algorithm that matches leading baselines on success and collision rates while using 26% fewer messages via graph transformers on dynamic communication graphs.
Coordination Architecture Shapes Continuous Demand Response Outcomes in Building Districts eess.SY · 2026-05-02 · unverdicted · none · ref 12
In a 25-building district simulation, the hybrid MPC-SAC architecture delivered the strongest balance of load tracking accuracy (4.8% NMBE), thermal comfort (16.8% exceedance), and lowest spatial variability compared to centralized MPC, decentralized SAC, MAPPO, and rule-based control.
A Communication-Efficient Multi-Agent Actor-Critic Algorithm for Distributed Reinforcement Learning cs.LG · 2019-07-06 · unverdicted · none · ref 15
A communication-efficient multi-agent actor-critic algorithm solves distributed RL on strongly connected directed graphs by transmitting only two scalar values per communication step.
Built Environment Reasoning from Remote Sensing Imagery Using Large Vision--Language Models cs.CL · 2026-05-08 · unverdicted · none · ref 83
Large vision-language models applied to multi-scale remote sensing imagery can generate recommendations on built environment design, constructability, land use, and risks for smart city decision-making.
Topology-Driven Anti-Entanglement Control for Soft Robots cs.RO · 2026-05-01 · unverdicted · none · ref 15
TD-MARL uses shared topological states and invariants to coordinate soft robots and reduce entanglement risk, outperforming standard DRL in simulated convergence and anti-winding performance.
A Distributionally Robust Reinforcement Learning Framework for Constrained Urban EV Dispatch cs.AI · 2026-04-28 · unreviewed · ref 31

Multi-agent actor-critic for mixed cooperative-competitive environments

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer