Denniston, Melanie J

Cruz Rivera S, Liu X, Chan A-W, Denniston AK, Calvert MJ · 2020 · DOI 10.1038/s41591-020-1037-7

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

open at publisher browse 4 citing papers

citation-role summary

background 1 method 1

citation-polarity summary

background 1 use method 1

representative citing papers

EuropeMedQA Study Protocol: A Multilingual, Multimodal Medical Examination Dataset for Language Model Evaluation

cs.CL · 2026-04-15 · unverdicted · novelty 7.0

EuropeMedQA is presented as the first comprehensive multilingual and multimodal medical examination dataset drawn from official regulatory exams in four European countries.

The Open-Box Fallacy: Why AI Deployment Needs a Calibrated Verification Regime

cs.AI · 2026-05-11 · unverdicted · novelty 6.0

AI deployment in high-stakes areas requires domain-scoped calibrated verification with monitoring and revocation, using a proposed six-component Verification Coverage standard instead of mechanistic interpretability.

Blinded Multi-Rater Comparative Evaluation of a Large Language Model and Clinician-Authored Responses in CGM-Informed Diabetes Counseling

cs.CL · 2026-04-16 · unverdicted · novelty 6.0

In a blinded study, an LLM-based agent generated higher-rated responses than clinicians for explaining CGM data in diabetes counseling, with similar safety flags.

Trends in AI and Human-AI Interaction in Clinical Trials -- A Hybrid Human-AI Exploration

cs.AI · 2026-05-27 · unverdicted · novelty 4.0

Registry analysis shows marked growth in AI-related clinical trials led by China and the US, with moderate human-AI agreement on interaction classification in a 100-record sample.

citing papers explorer

Showing 4 of 4 citing papers.

EuropeMedQA Study Protocol: A Multilingual, Multimodal Medical Examination Dataset for Language Model Evaluation cs.CL · 2026-04-15 · unverdicted · none · ref 13
EuropeMedQA is presented as the first comprehensive multilingual and multimodal medical examination dataset drawn from official regulatory exams in four European countries.
The Open-Box Fallacy: Why AI Deployment Needs a Calibrated Verification Regime cs.AI · 2026-05-11 · unverdicted · none · ref 5
AI deployment in high-stakes areas requires domain-scoped calibrated verification with monitoring and revocation, using a proposed six-component Verification Coverage standard instead of mechanistic interpretability.
Blinded Multi-Rater Comparative Evaluation of a Large Language Model and Clinician-Authored Responses in CGM-Informed Diabetes Counseling cs.CL · 2026-04-16 · unverdicted · none · ref 66
In a blinded study, an LLM-based agent generated higher-rated responses than clinicians for explaining CGM data in diabetes counseling, with similar safety flags.
Trends in AI and Human-AI Interaction in Clinical Trials -- A Hybrid Human-AI Exploration cs.AI · 2026-05-27 · unverdicted · none · ref 12
Registry analysis shows marked growth in AI-related clinical trials led by China and the US, with moderate human-AI agreement on interaction classification in a 100-record sample.

Denniston, Melanie J

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer