Fabian Mentzer, David Minnen, Eirikur Agustsson, and Michael Tschannen

Echomimicv3: 1 · 2025 · arXiv 2507.03905

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation

cs.CV · 2025-12-20 · unverdicted · novelty 7.0

MACE-Dance generates music-driven dance videos via cascaded motion and appearance experts, claiming SOTA results on a new benchmark dataset.

EchoTorrent: Towards Swift, Sustained, and Streaming Multi-Modal Video Generation

cs.CV · 2026-02-14 · unverdicted · novelty 4.0

EchoTorrent combines multi-teacher distillation, adaptive CFG calibration, hybrid long-tail forcing, and VAE decoder refinement to enable few-pass autoregressive streaming video generation with improved temporal consistency and audio-lip sync.

citing papers explorer

Showing 2 of 2 citing papers.

MACE-Dance: Motion-Appearance Cascaded Experts for Music-Driven Dance Video Generation cs.CV · 2025-12-20 · unverdicted · none · ref 1
MACE-Dance generates music-driven dance videos via cascaded motion and appearance experts, claiming SOTA results on a new benchmark dataset.
EchoTorrent: Towards Swift, Sustained, and Streaming Multi-Modal Video Generation cs.CV · 2026-02-14 · unverdicted · none · ref 13
EchoTorrent combines multi-teacher distillation, adaptive CFG calibration, hybrid long-tail forcing, and VAE decoder refinement to enable few-pass autoregressive streaming video generation with improved temporal consistency and audio-lip sync.

Fabian Mentzer, David Minnen, Eirikur Agustsson, and Michael Tschannen

fields

years

verdicts

representative citing papers

citing papers explorer