wav2vec 2.0: A framework for self-supervised learning of speech representations

Alexei Baevski, Yuhao Zhou, Abdelrahman Mohamed, Michael Auli, “wav2vec 2 · 2020

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

citation-role summary

baseline 1

citation-polarity summary

baseline 1

representative citing papers

Towards multi-modal forgery representation learning for AI-generated video detection and localization

cs.CV · 2026-05-08 · unverdicted · novelty 5.0

A multi-modal model with LMM semantic, ST visual, and PS audio branches enables simultaneous detection and fine-grained temporal localization of partial AI video forgeries, outperforming prior methods.

citing papers explorer

Showing 1 of 1 citing paper.

Towards multi-modal forgery representation learning for AI-generated video detection and localization cs.CV · 2026-05-08 · unverdicted · none · ref 17
A multi-modal model with LMM semantic, ST visual, and PS audio branches enables simultaneous detection and fine-grained temporal localization of partial AI video forgeries, outperforming prior methods.

wav2vec 2.0: A framework for self-supervised learning of speech representations

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer