Monitoring performance of clinical artificial intelligence in health care: a scoping review

Eline Sandvig Andersen, Johan Baden Birk-Korch, Rasmus Søgaard Hansen, Line Haugaard Fly, Richard Röttger, Diana Maria Cespedes Arcani + 2 more · 2024 · JBI Evidence Synthesis · DOI 10.11124/jbies-24-00042

2 Pith papers cite this work, alongside 38 external citations. Polarity classification is still indexing.

2 Pith papers citing it

38 external citations · Crossref

open at publisher browse 2 citing papers

representative citing papers

Case-Specific Rubrics for Clinical AI Evaluation: Methodology, Validation, and LLM-Clinician Agreement Across 823 Encounters

cs.AI · 2026-04-27 · unverdicted · novelty 6.0

Case-specific clinician rubrics for clinical AI notes achieve strong discrimination between outputs, high stability, and clinician-LLM agreement matching clinician-clinician levels at far lower cost.

End-to-End Evaluation and Governance of an EHR-Embedded AI Agent for Clinicians

cs.AI · 2026-04-30 · unverdicted · novelty 4.0

A multi-channel governance framework for a deployed ambient AI scribe achieved measurable improvements in clinician-validated performance and feedback quality through continuous rubric evaluation, live monitoring, and controlled experiments.

citing papers explorer

Showing 2 of 2 citing papers.

Case-Specific Rubrics for Clinical AI Evaluation: Methodology, Validation, and LLM-Clinician Agreement Across 823 Encounters cs.AI · 2026-04-27 · unverdicted · none · ref 1
Case-specific clinician rubrics for clinical AI notes achieve strong discrimination between outputs, high stability, and clinician-LLM agreement matching clinician-clinician levels at far lower cost.
End-to-End Evaluation and Governance of an EHR-Embedded AI Agent for Clinicians cs.AI · 2026-04-30 · unverdicted · none · ref 3
A multi-channel governance framework for a deployed ambient AI scribe achieved measurable improvements in clinician-validated performance and feedback quality through continuous rubric evaluation, live monitoring, and controlled experiments.

Monitoring performance of clinical artificial intelligence in health care: a scoping review

fields

years

verdicts

representative citing papers

citing papers explorer