Satellite Chasers: Divergent Adversarial Reinforcement Learning to Engage Intelligent Adversaries on Orbit

· 2024 · cs.RO · arXiv 2409.17443

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

open full Pith review browse 1 citing papers arXiv PDF

abstract

As space becomes increasingly crowded and contested, robust autonomous capabilities for multi-agent environments are gaining critical importance. Current autonomous systems in space primarily rely on optimization-based path planning or long-range orbital maneuvers, which have not yet proven effective in adversarial scenarios where one satellite is actively pursuing another. We introduce Divergent Adversarial Reinforcement Learning (DARL), a two-stage Multi-Agent Reinforcement Learning (MARL) approach designed to train autonomous evasion strategies for satellites engaged with multiple adversarial spacecraft. Our method enhances exploration during training by promoting diverse adversarial strategies, leading to more robust and adaptable evader models. We validate DARL through a cat-and-mouse satellite scenario, modeled as a partially observable multi-agent capture the flag game where two adversarial ``cat" spacecraft pursue a single ``mouse" evader. DARL's performance is compared against several benchmarks, including an optimization-based satellite path planner, demonstrating its ability to produce highly robust models for adversarial multi-agent space environments.

representative citing papers

GUIDE: Guided Updates for In-context Decision Evolution in LLM-Driven Spacecraft Operations

cs.MA · 2026-03-28 · unverdicted · novelty 6.0

GUIDE evolves a structured playbook of natural-language decision rules across episodes to improve LLM performance on adversarial spacecraft interception tasks without weight updates.

citing papers explorer

Showing 1 of 1 citing paper.

GUIDE: Guided Updates for In-context Decision Evolution in LLM-Driven Spacecraft Operations cs.MA · 2026-03-28 · unverdicted · none · ref 10 · internal anchor
GUIDE evolves a structured playbook of natural-language decision rules across episodes to improve LLM performance on adversarial spacecraft interception tasks without weight updates.

Satellite Chasers: Divergent Adversarial Reinforcement Learning to Engage Intelligent Adversaries on Orbit

fields

years

verdicts

representative citing papers

citing papers explorer