在临床试验中,总会面对一定程度上的偏差和不确定性,比如主分析数据的缺失,尤其是面对主要数据缺失时可能会影响到结果的稳健性*,还有一些像终点评价边界模糊、分析方法无法满足要求等问题时,我们需要换一种假设和方法,此时主分析的结果是否还能成立?我们就需要进行敏感性分析。
注:稳健性指统计方法对假设偏离的抵抗能力,体现为方法对总体假设变化或数据偏差的适应性,其性能可通过影响函数与崩溃点进行量化分析。

敏感性分析是临床试验中用于评估研究结果稳健性的重要方法,通过变换统计假设、数据定义或分析方法,验证主要结论是否在不同条件下保持一致,从而判断结果的可信度和可靠性。

临床试验中常因患者脱落、数据缺失等因素,导致结果存在不确定性,当试验数据存在缺失时,敏感性分析会采用不同的填补方法(如多重填补、末次观测值结转等)来验证主要结果是否因数据缺失处理方式的不同而产生显著变化。根据试验的要求不同以及计算成本的考量,并不是所有的数据缺失都要进行敏感性分析。一般情况下,当医疗器械试验中主分析数据的缺失较多时,通常要进行敏感性分析。

假设一项试验中纳入1000例患者(试验组:新型支架组500例,对照组:旧型支架组500例),主要疗效指标为术后6个月心血管事件发生率。由于主要疗效指标评价的时间节点距离入组时间较长,在项目初期的风险评估中即提示,可能会出现一定比例的优于脱落等原因而获取不到主评价数据的病例,而临床试验执行中,也确实发生了试验组20例脱落和对照组30例脱落的情况。为了评估脱落病例对疗效结论的影响,即假设脱落病例按照成功病例进行处理时是否对结论有影响,统计人员采用了差情况分析(将脱落病例均视为发生心血管事件,即将脱落病例视为失败病例)与佳情况分析(将脱落病例均视为未发生心血管事件,即将脱落病例视为成功病例)对比的敏感性分析。敏感性分析的结果如下:
新型支架组:心血管发生的例数=40(实际)+20(脱落)=60例,心血管发生率=60/500=12%及95%置信区间:(9.2% ,14.8%)。旧型支架组:心血管发生的例数=60(实际)+30(脱落)=90例,心血管发生率=90/500=18%及95%置信区间:(14.6% , 21.4%)。结论:新型支架组心血管发生率显著低于旧型支架组(9.2%vs14.6%),疗效更优。
新型支架组:心血管发生的例数=40(实际),心血管发生率=40/500=8%及95%置信区间(6.1% , 9.9%)。旧型支架组:心血管发生的例数=60(实际),心血管发生率=60/500=12%及95%置信区间(9.6% ,14.4%)。结论:新型支架组心血管发生率仍显著低于旧型支架组(6.1%vs9.6%)疗效更优。
从上述两种分析下均显示新型支架疗效优于旧型支架,说明研究结果对脱落病例的处理方式不敏感,结论稳健。
补充:
若出现结论不一致的情况:说明两种分析结果对脱落处理方式的具有敏感性,这种情况只有在前期加强随访以减少脱落才能避免结果的不稳健。这常常需要CRO公司具有丰富的经验,才能提前预知这一风险,并具有对于临床试验全局的把控能力才能在一开始的时候就对这个风险采取控制措施。

在上述评估新型心脏支架疗效的临床试验中,即使差情况分析(将脱落病例均视为发生心血管事件)已显示新型支架组心血管发生率显著低于旧型支架组心血管发生率,仍需进行敏感性分析的原因:
单一分析结果可能因数据缺失或模型假设而波动。敏感性分析通过多角度验证,确保结论在合理范围内成立。例如,若差情况分析支持新型支架优效性,而佳情况分析结论相反,则需警惕数据完整性对结果的影响。
指南中(如ICH E9(R1))明确要求临床试验需进行敏感性分析,以支持注册决策。监管机构通过多场景评估,确保结果的可靠性和可接受性。
所以敏感性分析并非因为结果不显著而进行,而是为了验证结果的稳健性、满足监管要求并识别潜在偏倚。在心脏支架试验中,即使差情况与佳情况分析均支持优效性,敏感性分析仍是确保结论可靠、增强决策信心的重要方法。
一项研究是否成功,不仅要看最终的结论是否成立,更要看:在不完美的数据、不确定的假设和方法变化下,结论是否依然“立得住”。敏感性分析就是这个“科学的保险机制”。它体现了统计师的专业性、CRO团队对数据的严肃态度,也体现了对患者、研究者、投资方和监管机构的高度负责。真正可靠的结果,不怕换角度检验。真正严谨的设计,必定给结论加上“敏感性分析的印章”。
