Detecting voice cloning attacks via timbre watermarking

Liu, C · 2023 · arXiv 2312.03410

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

representative citing papers

StreamMark: A Deep Learning-Based Semi-Fragile Audio Watermarking for Proactive Deepfake Detection

eess.AS · 2026-04-13 · unverdicted · novelty 6.0

StreamMark trains an Encoder-Distortion-Decoder network to embed semi-fragile watermarks that remain recoverable after benign audio transformations but drop to random accuracy under voice conversion and editing attacks.

HarmonicAttack: An Adaptive Cross-Domain Audio Watermark Removal

cs.SD · 2025-11-26 · conditional · novelty 6.0

A black-box audio watermark removal attack trained on limited samples that generalizes across datasets and watermark schemes with high attack success rates.

XAttnMark: Learning Robust Audio Watermarking with Cross-Attention

cs.SD · 2025-02-06 · unverdicted · novelty 5.0

XAttnMark is a new neural audio watermarking method using partial parameter sharing, cross-attention for message retrieval, temporal conditioning, and a psychoacoustic TF masking loss that reports state-of-the-art detection and attribution robustness.

citing papers explorer

Showing 3 of 3 citing papers.

StreamMark: A Deep Learning-Based Semi-Fragile Audio Watermarking for Proactive Deepfake Detection eess.AS · 2026-04-13 · unverdicted · none · ref 16
StreamMark trains an Encoder-Distortion-Decoder network to embed semi-fragile watermarks that remain recoverable after benign audio transformations but drop to random accuracy under voice conversion and editing attacks.
HarmonicAttack: An Adaptive Cross-Domain Audio Watermark Removal cs.SD · 2025-11-26 · conditional · none · ref 13
A black-box audio watermark removal attack trained on limited samples that generalizes across datasets and watermark schemes with high attack success rates.
XAttnMark: Learning Robust Audio Watermarking with Cross-Attention cs.SD · 2025-02-06 · unverdicted · none · ref 30
XAttnMark is a new neural audio watermarking method using partial parameter sharing, cross-attention for message retrieval, temporal conditioning, and a psychoacoustic TF masking loss that reports state-of-the-art detection and attribution robustness.

Detecting voice cloning attacks via timbre watermarking

fields

years

verdicts

representative citing papers

citing papers explorer