Markov games as a framework for multi-agent rein- forcement learning

· 1994

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

representative citing papers

ATRS: Adaptive Trajectory Re-splitting via a Shared Neural Policy for Parallel Optimization

cs.RO · 2026-04-24 · unverdicted · novelty 7.0

ATRS uses a shared neural policy in a multi-agent MDP to adaptively re-split trajectory segments during parallel ADMM optimization, cutting iterations by up to 26% and time by 19.1% with zero-shot generalization.

Finite-Time Analysis of Q-Value Iteration for General-Sum Stackelberg Games

cs.LG · 2026-04-06 · unverdicted · novelty 7.0

Provides the first finite-time convergence guarantees for Q-value iteration in general-sum Stackelberg Markov games.

citing papers explorer

Showing 2 of 2 citing papers.

ATRS: Adaptive Trajectory Re-splitting via a Shared Neural Policy for Parallel Optimization cs.RO · 2026-04-24 · unverdicted · none · ref 17
ATRS uses a shared neural policy in a multi-agent MDP to adaptively re-split trajectory segments during parallel ADMM optimization, cutting iterations by up to 26% and time by 19.1% with zero-shot generalization.
Finite-Time Analysis of Q-Value Iteration for General-Sum Stackelberg Games cs.LG · 2026-04-06 · unverdicted · none · ref 8
Provides the first finite-time convergence guarantees for Q-value iteration in general-sum Stackelberg Markov games.

Markov games as a framework for multi-agent rein- forcement learning

fields

years

verdicts

representative citing papers

citing papers explorer