Rethinking patch dependence for masked autoencoders

Fu, L · 2024 · arXiv 2401.14391

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Remembering by Reconstructing: Domain Incremental Learning With Test-Time Training on Video Streams

cs.CV · 2026-05-29 · unverdicted · novelty 7.0

Domain-incremental video learning that permits forgetting through per-domain LoRA adapters and recovers the matching adapter at inference via test-time training on a self-supervised MAE reconstruction head.

AaSP: Aliasing-aware Self-Supervised Pre-Training for Audio Spectrogram Transformers

cs.SD · 2025-12-03 · unverdicted · novelty 6.0

AaSP learns aliasing-stable audio representations by augmenting patch tokens with adaptive subband features from alias-prone bands and using teacher-student masked modeling plus multi-mask contrastive regularization, reaching SOTA on AS-20K, ESC-50, and NSynth under fine-tuning.

citing papers explorer

Showing 2 of 2 citing papers.

Remembering by Reconstructing: Domain Incremental Learning With Test-Time Training on Video Streams cs.CV · 2026-05-29 · unverdicted · none · ref 11
Domain-incremental video learning that permits forgetting through per-domain LoRA adapters and recovers the matching adapter at inference via test-time training on a self-supervised MAE reconstruction head.
AaSP: Aliasing-aware Self-Supervised Pre-Training for Audio Spectrogram Transformers cs.SD · 2025-12-03 · unverdicted · none · ref 36
AaSP learns aliasing-stable audio representations by augmenting patch tokens with adaptive subband features from alias-prone bands and using teacher-student masked modeling plus multi-mask contrastive regularization, reaching SOTA on AS-20K, ESC-50, and NSynth under fine-tuning.

Rethinking patch dependence for masked autoencoders

fields

years

verdicts

representative citing papers

citing papers explorer