Citywalker: Learning embodied urban navigation from web-scale videos

Xinhao Liu, Jintong Li, Yicheng Jiang, Niranjan Sujay, Zhicheng Yang, Juexiao Zhang, John Abanes, Jing Zhang, Chen Feng · 2025

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

STRNet: Visual Navigation with Spatio-Temporal Representation through Dynamic Graph Aggregation

cs.CV · 2026-04-03 · conditional · novelty 7.0

STRNet improves goal-conditioned visual navigation by replacing simplistic encoders and pooling with a spatio-temporal fusion module that performs spatial graph reasoning and hybrid temporal modeling.

citing papers explorer

Showing 1 of 1 citing paper.

STRNet: Visual Navigation with Spatio-Temporal Representation through Dynamic Graph Aggregation cs.CV · 2026-04-03 · conditional · none · ref 22
STRNet improves goal-conditioned visual navigation by replacing simplistic encoders and pooling with a spatio-temporal fusion module that performs spatial graph reasoning and hybrid temporal modeling.

Citywalker: Learning embodied urban navigation from web-scale videos

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer