arXiv preprint arXiv:2502.07620 (2025)

[Online] · 2025 · arXiv 2502.07620

6 Pith papers cite this work. Polarity classification is still indexing.

6 Pith papers citing it

read on arXiv browse 6 citing papers

citation-role summary

background 4

citation-polarity summary

background 4

representative citing papers

Autonomous Drift Learning in Data Streams: A Unified Perspective

cs.LG · 2026-05-02 · unverdicted · novelty 7.0

A survey proposes a novel 3D taxonomy classifying drifts into time stream, data stream, and model stream categories to unify research on non-stationary autonomous learning.

XrayClaw: Cooperative-Competitive Multi-Agent Alignment for Trustworthy Chest X-ray Diagnosis

cs.CV · 2026-04-03 · unverdicted · novelty 7.0

XrayClaw deploys cooperative-competitive multi-agent alignment and Competitive Preference Optimization to raise diagnostic accuracy, reasoning fidelity, and generalization on chest X-ray benchmarks.

Bandwidth-constrained Variational Message Encoding for Cooperative Multi-agent Reinforcement Learning

cs.LG · 2025-12-11 · unverdicted · novelty 7.0

BVME uses variational Gaussian message encoding with KL regularization to maintain or improve multi-agent coordination performance while using 67-83% fewer message dimensions than naive compression on SMAC and MPE benchmarks.

Turning Drift into Constraint: Robust Reasoning Alignment in Non-Stationary Multi-Stream Environments

cs.CV · 2025-10-05 · unverdicted · novelty 7.0

APO framework aligns multi-source MLLM reasoning under concept drift by using inter-model divergences as negative constraints via supervised bootstrapping and multi-negative Plackett-Luce optimization, with a 7B model outperforming proprietary sources on chest X-ray tasks and a new CXR-MAX benchmark

Heterogeneous Information-Bottleneck Coordination Graphs for Multi-Agent Reinforcement Learning

cs.AI · 2026-05-17 · unverdicted · novelty 6.0

HIBCG learns group-aware sparse coordination graphs in MARL using graph information bottleneck with a block-diagonal prior for edge selection and water-filling for capacity allocation.

Towards Robust Endogenous Reasoning: Unifying Drift Adaptation in Non-Stationary Tuning

cs.LG · 2026-04-17 · unverdicted · novelty 5.0

CPO++ adapts reinforcement fine-tuning of MLLMs to endogenous multi-modal concept drift through counterfactual reasoning and preference optimization, yielding better coherence and cross-domain robustness in safety-critical settings.

citing papers explorer

Showing 6 of 6 citing papers.

Autonomous Drift Learning in Data Streams: A Unified Perspective cs.LG · 2026-05-02 · unverdicted · none · ref 191
A survey proposes a novel 3D taxonomy classifying drifts into time stream, data stream, and model stream categories to unify research on non-stationary autonomous learning.
XrayClaw: Cooperative-Competitive Multi-Agent Alignment for Trustworthy Chest X-ray Diagnosis cs.CV · 2026-04-03 · unverdicted · none · ref 38
XrayClaw deploys cooperative-competitive multi-agent alignment and Competitive Preference Optimization to raise diagnostic accuracy, reasoning fidelity, and generalization on chest X-ray benchmarks.
Bandwidth-constrained Variational Message Encoding for Cooperative Multi-agent Reinforcement Learning cs.LG · 2025-12-11 · unverdicted · none · ref 44
BVME uses variational Gaussian message encoding with KL regularization to maintain or improve multi-agent coordination performance while using 67-83% fewer message dimensions than naive compression on SMAC and MPE benchmarks.
Turning Drift into Constraint: Robust Reasoning Alignment in Non-Stationary Multi-Stream Environments cs.CV · 2025-10-05 · unverdicted · none · ref 50
APO framework aligns multi-source MLLM reasoning under concept drift by using inter-model divergences as negative constraints via supervised bootstrapping and multi-negative Plackett-Luce optimization, with a 7B model outperforming proprietary sources on chest X-ray tasks and a new CXR-MAX benchmark
Heterogeneous Information-Bottleneck Coordination Graphs for Multi-Agent Reinforcement Learning cs.AI · 2026-05-17 · unverdicted · none · ref 52
HIBCG learns group-aware sparse coordination graphs in MARL using graph information bottleneck with a block-diagonal prior for edge selection and water-filling for capacity allocation.
Towards Robust Endogenous Reasoning: Unifying Drift Adaptation in Non-Stationary Tuning cs.LG · 2026-04-17 · unverdicted · none · ref 59
CPO++ adapts reinforcement fine-tuning of MLLMs to endogenous multi-modal concept drift through counterfactual reasoning and preference optimization, yielding better coherence and cross-domain robustness in safety-critical settings.

arXiv preprint arXiv:2502.07620 (2025)

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer