Research Square , publisher=

Towards Generalist Robot Policies: What Matters in Building Vision-Language-Action Models , author= · 2025 · DOI 10.21203/rs.3.rs-5770637/v1

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

open at publisher browse 1 citing papers

representative citing papers

S$^2$-VLA: State-Space Guided Vision-Language-Action Models for Long-Horizon Manipulation

cs.RO · 2026-06-26 · unverdicted · novelty 5.0

S²-VLA uses a state-space model to maintain a belief state that produces dynamic gating weights for fusing visual, language, and action features, claiming better long-horizon manipulation than 7B models with only 2B parameters.

citing papers explorer

Showing 1 of 1 citing paper.

S$^2$-VLA: State-Space Guided Vision-Language-Action Models for Long-Horizon Manipulation cs.RO · 2026-06-26 · unverdicted · none · ref 45
S²-VLA uses a state-space model to maintain a belief state that produces dynamic gating weights for fusing visual, language, and action features, claiming better long-horizon manipulation than 7B models with only 2B parameters.

Research Square , publisher=

fields

years

verdicts

representative citing papers

citing papers explorer