医学影像AI医疗器械临床验证的"金标准"

医学影像AI的黄金标准

FDA、NMPA、EMA全球三大监管机构已形成共识：对于辅助诊断类AI产品，MRMC（Multiple Reader Multiple Case）设计是生成临床证据的首选方案。

什么是MRMC？MRMC是一种专为医学影像AI评估优化的临床试验范式，其核心是在控制混杂因素的同时，精准量化AI的净效应，通过"多阅片者、多病例、交叉对照"的三层架构实现。

第一层架构：多阅片者（6-12名）。覆盖不同年资、不同机构类型的医师群体。这一设计模拟真实临床环境中的诊疗团队差异，消除"明星医生"效应，确保研究结果具备外推性。单中心单阅片者的结果无法复制到真实场景，而MRMC的设计逻辑从根本上解决了这一监管关切。

第二层架构：多病例（400-500例）。病例库需涵盖疾病全谱系、不同影像表现、不同难度梯度。样本量基于功效分析确定，确保80-90%检验效能，α=0.025（单侧）。这一设计避免病例选择偏倚，使结果反映真实临床复杂性。

第三层架构：交叉对照（核心机制）。每位医师在"有AI辅助"和"无AI辅助"两种模式下，独立完成相同病例集的阅片。这一"自身前后对照"设计，消除了医生个体差异的混杂，直接建立"AI辅助"与"性能提升"的因果推断关系。

MRMC设计具有四大优势：（1）因果推断强度高。交叉设计通过自身对照消除个体差异，相比平行对照的组间比较，因果链条更为清晰直接；（2）资源效率优化。仅需6-12名医师即可完成平行对照需12-24名医师的证据强度。医生资源减少50%，总阅片数减少50%（6000次 vs 12000次），试验周期缩短3-6个月；（3）统计学体系成熟。固定效应/随机效应双模型、方差分量分解、异质性检验（I²）等分析方法构成完整的统计框架，结果具有跨机构可比性；（4）监管认可度广。FDA指南明确推荐，NMPA指导原则强调，CE-MDR要求满足。同一设计可支撑多国申报，实现"一套数据、全球适用"。

MRMC设计不是减少病例数（400-500例是满足统计效能的必要样本），而是通过设计创新，以相同病例数实现更强因果推断和更低资源消耗。这是从"技术验证"走向"临床验证"的科学桥梁。

扫描下方的二维码订阅“CIRS医械合规动态”！实时传递最新医疗器械监管法规动态，分享医疗器械注册成功经验及经典案例跟踪医疗器械最新产品安全与法规监管动态，获得最新一手资讯。

医疗器械

① 凡本网注明"稿件来源：“杭州瑞旭科技集团有限公司"的所有文字、图片和音视频稿件，版权均属杭州瑞旭科技集团有限公司所有，任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站，在下载使用时必须注明"稿件来源：杭州瑞旭科技集团有限公司"，违者本网将依法追究责任。

② 本网未注明"稿件来源：杭州瑞旭科技集团有限公司 "的文/图等稿件均为转载稿，本网转载出于传递更多信息之目的，并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用，必须保留本网注明的"稿件来源"，并自负版权等法律责任。如擅自篡改为"稿件来源：杭州瑞旭科技集团有限公司"，本网将依法追究责任。如对稿件内容有疑议，请及时与我们联系。

③ 如本网转载稿涉及版权等问题，请作者在两周内速来电或来函与杭州瑞旭科技集团有限公司联系。