Jiahui Zhang, Fangneng Zhan, Christian Theobalt, and Shijian Lu

URLhttps://arxiv · 2025 · arXiv 2507.10547

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

ChannelTok: Efficient Flexible-Length Vision Tokenization

cs.CV · 2026-06-03 · unverdicted · novelty 7.0

ChannelTok introduces channel-wise tokenization with stochastic tail-dropping to achieve rFID 2.92 on ImageNet at 8.6x faster decoding and 2.1x smaller size than prior flexible tokenizers.

NSVQ: Mitigating Codebook Collapse by Stabilizing Encoder Drift in Vector Quantization

cs.CV · 2026-06-09 · unverdicted · novelty 5.0

NSVQ mitigates codebook collapse in large-codebook VQ by addressing encoder drift via non-stationary loss, replacement, and staged freezing, improving rFID from 2.39 to 2.10 on ImageNet-1k while achieving 100% utilization.

citing papers explorer

Showing 2 of 2 citing papers after filters.

ChannelTok: Efficient Flexible-Length Vision Tokenization cs.CV · 2026-06-03 · unverdicted · none · ref 28
ChannelTok introduces channel-wise tokenization with stochastic tail-dropping to achieve rFID 2.92 on ImageNet at 8.6x faster decoding and 2.1x smaller size than prior flexible tokenizers.
NSVQ: Mitigating Codebook Collapse by Stabilizing Encoder Drift in Vector Quantization cs.CV · 2026-06-09 · unverdicted · none · ref 18
NSVQ mitigates codebook collapse in large-codebook VQ by addressing encoder drift via non-stationary loss, replacement, and staged freezing, improving rFID from 2.39 to 2.10 on ImageNet-1k while achieving 100% utilization.

Jiahui Zhang, Fangneng Zhan, Christian Theobalt, and Shijian Lu

fields

years

verdicts

representative citing papers

citing papers explorer