Muvi: Video-to-music generation with se- mantic alignment and rhythmic synchronization,

· 2024 · arXiv 2410.12957

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

JenBridge: Adaptive Long-Form Video Soundtracking across Scene Transitions

cs.SD · 2026-06-01 · unverdicted · novelty 6.0

JenBridge pretrains a flow-matching Transformer on text-audio data then adapts it with video conditioning and an LLM director to select transitions, claiming better coherence than prior methods on a new LVS benchmark.

AudioX-Turbo: A Unified Framework for Efficient Anything-to-Audio Generation

cs.SD · 2026-06-10 · unverdicted · novelty 5.0

AudioX-Turbo distills a Multimodal Diffusion Transformer into a 4-step student model for efficient multimodal anything-to-audio generation, trained on a new 9.2M-sample dataset IF-caps-Pro.

citing papers explorer

Showing 2 of 2 citing papers after filters.

JenBridge: Adaptive Long-Form Video Soundtracking across Scene Transitions cs.SD · 2026-06-01 · unverdicted · none · ref 12
JenBridge pretrains a flow-matching Transformer on text-audio data then adapts it with video conditioning and an LLM director to select transitions, claiming better coherence than prior methods on a new LVS benchmark.
AudioX-Turbo: A Unified Framework for Efficient Anything-to-Audio Generation cs.SD · 2026-06-10 · unverdicted · none · ref 45
AudioX-Turbo distills a Multimodal Diffusion Transformer into a 4-step student model for efficient multimodal anything-to-audio generation, trained on a new 9.2M-sample dataset IF-caps-Pro.

Muvi: Video-to-music generation with se- mantic alignment and rhythmic synchronization,

fields

years

verdicts

representative citing papers

citing papers explorer