Data and Training Details We collected 30k hours of in-the-wild songs standardized to 44.1kHz

Experiments 3 · 2013 · arXiv 6270.8013

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Towards Unified Song Generation and Singing Voice Conversion with Accompaniment Co-Generation

cs.SD · 2026-06-05 · unverdicted · novelty 7.0

UniSinger unifies speaker-cloned song generation and accompaniment co-generation SVC in one multimodal diffusion transformer model trained with curriculum learning via task-specific modality masking.

citing papers explorer

Showing 1 of 1 citing paper.

Towards Unified Song Generation and Singing Voice Conversion with Accompaniment Co-Generation cs.SD · 2026-06-05 · unverdicted · none · ref 3
UniSinger unifies speaker-cloned song generation and accompaniment co-generation SVC in one multimodal diffusion transformer model trained with curriculum learning via task-specific modality masking.

Data and Training Details We collected 30k hours of in-the-wild songs standardized to 44.1kHz

fields

years

verdicts

representative citing papers

citing papers explorer