Test-Time Adaptation For Speech Enhancement Via Mask Polarization

· 2026 · eess.AS · arXiv 2601.14770

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

open full Pith review browse 1 citing papers arXiv PDF

abstract

Adapting speech enhancement (SE) models to unseen environments is crucial for practical deployments, yet test-time adaptation (TTA) for SE remains largely under-explored due to a lack of understanding of how SE models degrade under domain shifts. We observe that mask-based SE models lose confidence under domain shifts, with predicted masks becoming flattened and losing decisive speech preservation and noise suppression. Based on this insight, we propose mask polarization (MPol), a lightweight TTA method that restores mask bimodality through distribution comparison using the Wasserstein distance. MPol requires no additional parameters beyond the trained model, making it suitable for resource-constrained edge deployments. Experimental results across diverse domain shifts and architectures demonstrate that MPol achieves very consistent gains that are competitive with significantly more complex approaches.

representative citing papers

Test-Time Adaptation For Speech Enhancement Via Mask Polarization

eess.AS · 2026-01-21 · unverdicted · novelty 6.0

Mask polarization restores bimodality in SE model predictions via Wasserstein distance at test time, delivering consistent gains across domain shifts and architectures.

citing papers explorer

Showing 1 of 1 citing paper.

Test-Time Adaptation For Speech Enhancement Via Mask Polarization eess.AS · 2026-01-21 · unverdicted · none · ref 1 · internal anchor
Mask polarization restores bimodality in SE model predictions via Wasserstein distance at test time, delivering consistent gains across domain shifts and architectures.

Test-Time Adaptation For Speech Enhancement Via Mask Polarization

fields

years

verdicts

representative citing papers

citing papers explorer