撰稿人:
沙琳琳
审阅人:
魏晓玲,韦加为
严平,朱宏杰,潘国华
摘要
在估计目标框架下的临床试验,分析方法,缺失数据的处理应与确定的估计目标保持一致。不同的伴发事件及其相应的处理策略导致的数据缺失根据其对疗效评估的影响可能被假定为随机缺失或非随机缺失。临界点分析通过对缺失机制进行不同的建模假设来评估试验结论的稳健性,是各地区的监管部门非常感兴趣的一种敏感性分析。8月1日DIA统计论坛特邀诺华全球药物研发生物统计总监韦加为博士担任主持人,诺华全球药物研发生物统计副总监魏晓玲担任演讲嘉宾主讲估计目标框架下的敏感性分析-临界值分析方法,并邀请了强生中国统计决策部负责人潘国华博士,恒瑞医药临床研发部统计执行总监和统计负责人严平博士,百济神州全球统计和数据科学部总监朱宏杰博士担任讨论嘉宾。
估计目标以及估计目标框架
估计目标是对治疗效应的精确描述,反映了根据既定临床试验目的提出的临床问题。它在群体层面上总结了同一批患者在不同治疗条件下的结果。估计目标根据特定的试验目的定义估计的目标(即“要估计什么”),然后可以选择合适的估计方法(即分析方法,称为主“估计方法”)。主估计方法以特定假设为基础,为了探索根据主估计方法所作的推断对偏离其基本假设的稳健性,应针对同一估计目标采用一种或多种形式进行敏感性分析。
Source: E9(R1):临床试验中的估计目标与敏感性分析(E9指导原则增补文件) 『临床试验百科』 (gcp.wiki)
伴发事件
伴发事件是估计目标五个属性中的一个,指治疗开始后发生的事件,可影响与临床问题相关的观测结果的解读或存在。在描述临床问题时,有必要阐明伴发事件,以便准确定义需要估计的治疗效应。伴发事件在试验设计之前要进行定义,所以并不是缺失数据问题。
缺失数据
缺失数据,对于既定估计目标的分析有意义、但未收集到的数据。它应该与不存在的数据,或由于伴发事件而被认为没有意义的数据区分开来。处理缺失数据的方法应该和估计目标是一致的。现在学界对于缺失数据和伴发事件的区分还是有不一样的讨论。
从操作层面角度考量,如何尽量减少缺失数据呢?第一点,及时和操作团队有效沟通,尽量减少数据的缺失,第二点, 尽量详尽地记录缺失数据的相关信息,为什么会缺失数据,记录尽量多的证据来解释数据。
敏感性分析
敏感性分析,是指针对模型假设的偏离或者数据局限,探索估计目标对应的主要推论/结论的稳健性的一系列分析。在估计目标框架下的敏感性分析可以聚焦于特定分析中假设偏差的敏感性,而不是分析方法选择的敏感性。
对于同一估计目标,应该预先规定一项或多项分析来评估这些假设,目的是验证根据主估计方法得出的估计值是否对假设偏离具有稳健性。其衡量标准可以是对假设不同程度的偏离是否会改变结果的统计学或临床意义(如临界点分析)。当计划和实施敏感性分析时,同时改变主要分析的多个方面可能难以确定由哪些假设导致了目前所观测到的潜在差异。因此,通常采用结构化的方法,指定不同分析背后的假设的变化,而不是简单地基于一组不同的假设比较不同分析的结果。应根据具体情况考虑是否需要同时改变多个假设的分析。在评估不同分析的解释和相关性时,区分可验证的和不可验证的假设可能是有帮助的。对应于特定估计目标的缺失数据,以及与特定估计目标不直接相关的数据,两者之间存在区别,由此在分析中产生了不同类别的假设,需要通过敏感性分析来检查。
补充分析
除了主要分析和敏感性分析之外,还可以对估计目标进行补充分析,以提供对治疗效应更全面的了解。补充分析在解释试验结果方面的作用通常较小。每项试验均需考虑补充分析的必要性和作用。如果估计目标框架中的五个属性发生了改变,那么就为补充分析,如果没有发生改变则为敏感性分析。
临界点分析法
在估计目标框架下,临界点分析法(tipping point analysis)是用不同的方法来预测缺失数据。在主要分析预测值的基础上添加“𝛿” 到预测中,在一定范围内改变,如果找到一个点使得结果的方向改变了,这个点就称为临界点(tipping point)。在不确定数据缺失机制数据是否满足假设缺失数据机制的情况下,可以对假设的多重插补进行敏感性分析。
临界点分析法可以摆脱对假设的依赖,可以量化,比较具有临床意义,在非肿瘤领域中应用比较广泛。同时临界点分析也有一些挑战,比如在解释结果的时候要注意偏离程度,偏离多少可能发生转变。
临界点分析法 案例分析
-
感兴趣的临床问题:在16周之后试验药物和安慰剂对比的疗效的情况。
-
主要终点:16周后基于三个连续变量的应答情况的复合变量终点
-
主要分析方法:逻辑回归模型,解释变量为受试者基线信息。
-
伴发事件以及相应的策略:
伴发事件 |
统计策略 |
缺失数据类型 |
急救用药 |
复合变量策略:将该受试者设为非应答者 |
没有缺失数据 |
由于不良反应或疗法不足导致的治疗中止 |
复合变量策略:将该受试者设为非应答者 |
没有缺失数据 |
任何原因(不良事件或疗法不足事件除外)导致的治疗中止 |
假想策略:感兴趣的治疗效应是受试者没有停止用药 |
缺失数据 |
COVID-19 相关事件 |
疗法策略:忽略该类事件 |
可能存在缺失数据 |
-
缺失数据的处理方式:多重插补(MI)
几种不同的临界点分析的方法以及其优缺点:
讨论之后,选择了第三种方法,从临床角度更容易解读也和主要终点的联系更为直接。但第三种方法如何抽样,无放回还是有放回抽样,抽样次数等都需要仔细考虑。所以做了以下的模拟。
模拟分析设计
K代表抽样次数,分别为1,10,30;抽样方式有无放回或有放回;抽样集是
是从所有缺失患者里面抽样,还是只从那些被插补为应答的受试者里面抽样
,一共有 3 x 2 x 2 =12种组合。使用相对偏差的绝对值(ARD)来衡量不同抽样方法的差别。
K=1 与 K = 10, 500次无放回抽样的结果如下,ARD差距很小低于0.005,因此抽样次数不同对结果的影响很小。抽样给估计值带来的额外的变异度会特别小。抽样一次问题不大。因此选择K=1.
500次有放回和无放回抽样的结果如下,ARD差距很小低于0.005,因此抽样方式不同对结果的影响很小。无放回抽样更接近与临界点的概念,在前一个shift的个数基础上增加shift个数,也更容易操作,所以会选择无放回抽样。
黄色代表从全部数据集中抽取,蓝色代表从应答者中抽取,正如预期的那样,从插补为应答者的受试者中shift得出的估计疗效值比从所有16周数据缺失的受试者里面shift得出的估计疗效值下降得更快。考虑到从插补为应答者的受试者中shift,就更容易解释。这里考虑从插补为应答者的受试者中shift。
基于以上的结果,最终选择了K=1,在有应答人群中,无放回抽样法。其优势在于与主要终点直接相关联,容易解释其临床意义。
总而言之,临界点分析作为在估计目标框架下的敏感性分析方法的一种,在非肿瘤领域应用还是比较广泛的也被监管机构所接受,拥有可视化更便于解释临床意义等优点。但同时在某些特定的框架下,临界点分析也面临着一些挑战,比如当终点为复合终点时,需要更多的思考和讨论,也需要和其他各个部门保持有效的沟通。