Vividmed: Vision language model with versatile visual grounding for medicine.arXiv preprint arXiv:2410.12694,

Luo, L · arXiv 2410.12694

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

MedSIGHT: Towards Grounded Visual Comprehension in Medical Large Vision-Language Models

cs.CV · 2026-06-04 · unverdicted · novelty 6.0

MedSIGHT unifies medical image comprehension and segmentation in Med-LVLMs via a Region Perceiver module and region codebook, trained progressively on 72K pairs to reach SOTA on both tasks across modalities.

citing papers explorer

Showing 1 of 1 citing paper.

MedSIGHT: Towards Grounded Visual Comprehension in Medical Large Vision-Language Models cs.CV · 2026-06-04 · unverdicted · none · ref 11
MedSIGHT unifies medical image comprehension and segmentation in Med-LVLMs via a Region Perceiver module and region codebook, trained progressively on 72K pairs to reach SOTA on both tasks across modalities.

Vividmed: Vision language model with versatile visual grounding for medicine.arXiv preprint arXiv:2410.12694,

fields

years

verdicts

representative citing papers

citing papers explorer