LM4LV: A frozen large language model for low-level vision tasks.arXiv preprint arXiv:2405.15734, 2024

Boyang Zheng, Jinjin Gu, Shijun Li, Chao Dong · 2024 · arXiv 2405.15734

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Mitigating State Aliasing in Vision-Language-Action Models via Inverse Dynamics Learning

cs.CV · 2026-05-28 · unverdicted · novelty 6.0

Inverse dynamics prediction is added as an auxiliary task to reduce state aliasing in VLA models by directly supervising the vision encoder on action-relevant visual distinctions using only standard observation-action pairs.

citing papers explorer

Showing 1 of 1 citing paper.

Mitigating State Aliasing in Vision-Language-Action Models via Inverse Dynamics Learning cs.CV · 2026-05-28 · unverdicted · none · ref 5
Inverse dynamics prediction is added as an auxiliary task to reduce state aliasing in VLA models by directly supervising the vision encoder on action-relevant visual distinctions using only standard observation-action pairs.

LM4LV: A frozen large language model for low-level vision tasks.arXiv preprint arXiv:2405.15734, 2024

fields

years

verdicts

representative citing papers

citing papers explorer