Masked modeling duo: Towards a universal audio pre-training frame- work

· 2024

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

representative citing papers

Meta-Ensemble Learning with Diverse Data Splits for Improved Respiratory Sound Classification

cs.LG · 2026-04-27 · unverdicted · novelty 5.0

Meta-ensemble learning on diverse ICBHI data splits reaches 66.49% Score and improves generalization on two external datasets.

ULTRAS -- Unified Learning of Transformer Representations for Audio and Speech Signals

eess.AS · 2026-04-08 · unverdicted · novelty 5.0

ULTRAS unifies audio and speech representation learning in a single transformer by applying patch masking to log-mel spectrograms and using a joint spectral-temporal prediction loss.

citing papers explorer

Showing 2 of 2 citing papers.

Meta-Ensemble Learning with Diverse Data Splits for Improved Respiratory Sound Classification cs.LG · 2026-04-27 · unverdicted · none · ref 29
Meta-ensemble learning on diverse ICBHI data splits reaches 66.49% Score and improves generalization on two external datasets.
ULTRAS -- Unified Learning of Transformer Representations for Audio and Speech Signals eess.AS · 2026-04-08 · unverdicted · none · ref 14
ULTRAS unifies audio and speech representation learning in a single transformer by applying patch masking to log-mel spectrograms and using a joint spectral-temporal prediction loss.

Masked modeling duo: Towards a universal audio pre-training frame- work

fields

years

verdicts

representative citing papers

citing papers explorer