Evolving diagnostic agents in a virtual clinical environment.arXiv preprint arXiv:2510.24654, 2025

Pengcheng Qiu, Chaoyi Wu, Junwei Liu, Qiaoyu Zheng, Yusheng Liao, Haowen Wang, Yun Yue, Qianrui Fan, Shuai Zhen, Jian Wang, et al · 2025 · arXiv 2510.24654

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

read on arXiv browse 1 citing papers

representative citing papers

Evaluating Large Language Models in Dynamic Clinical Decision-Making with Standardized Patient Cases

cs.CL · 2026-06-03 · unverdicted · novelty 7.0

MedSP1000 benchmark shows top LLMs complete at most 60.4% of expert rubric items during multi-turn standardized patient simulations.

citing papers explorer

Showing 1 of 1 citing paper.

Evaluating Large Language Models in Dynamic Clinical Decision-Making with Standardized Patient Cases cs.CL · 2026-06-03 · unverdicted · none · ref 23
MedSP1000 benchmark shows top LLMs complete at most 60.4% of expert rubric items during multi-turn standardized patient simulations.

Evolving diagnostic agents in a virtual clinical environment.arXiv preprint arXiv:2510.24654, 2025

fields

years

verdicts

representative citing papers

citing papers explorer