您当前的位置:检测资讯 > 法规标准
嘉峪检测网 2022-06-19 04:02
摘 要Abstract
2022 年1 月21 日我国正式适用ICH E9(R1)。本文对E9(R1)的基本背景和主要内容以及我国在适用E9(R1)前所开展的准备工作进行了简要介绍,并从监管机构的角度着重阐述了对适用E9(R1)的初步考虑,为在我国开展的药物临床试验适用该指导原则提供参考。
ICH E9 (R1) was officially implemented in China on January 21, 2022. This paper briefly introduces the background and main contents of E9 (R1) and the preparatory work carried out in China before the implementation of E9 (R1), and discusses the preliminary considerations of implementing E9 (R1) from the perspective of drug regulators, so as to inform clinical trials conducted in China following this guideline.
关键词Key words
E9(R1);技术审评;监管考虑
E9 (R1); technical review; regulatory considerations
2017 年6 月,我国成为国际人用药品注册技术协调会(ICH)成员[1]。2018 年6 月, 我国当选为ICH 管理委员会成员[2]。E9(R1)是我国成为ICH 成员后参与协调的首批指导原则之一[3]。2022 年1 月21 日,我国正式适用E9(R1)[4], 距我国首次参与协调该指导原则已历时4 年多。适用E9(R1)会对药物临床试验的设计、实施、数据收集和统计分析产生较大影响,一直被工业界和学界重点关注。本文对E9(R1)的基本背景和主要内容以及我国在适用E9(R1)前所开展的准备工作进行了简要介绍,并从监管机构的角度着重阐述了对适用E9(R1) 的初步考虑,为在我国开展的药物临床试验适用该指导原则提供参考。
1、E9(R1)简介
1.1 基本背景
虽然药物临床试验是各国药品监管机构做出监管决策的主要依据,但对药物真实疗效的推断往往会受到一些重要因素的影响,如随访时间、治疗依从性、替代治疗、补救治疗、提前终止治疗、数据缺失等,同时也会受到多种敏感性分析结果的影响。当各国监管机构之间或者内部在这些因素影响下对估计目标(estimand)的选择和定义以及对敏感性分析的计划、实施和解释存在不同理解时,可能导致推断和决策不一致。因此,需要建立一个框架以促使各国监管机构之间或者内部能够正确选择和明确定义估计目标并提供计划、实施和解释敏感性分析的可遵循的标准。2014 年10 月,ICH 指导委员会(ICH Steering Committee)批准对该议题进行协调,作为E9(《临床试验的统计学原则》)的增补文件,即E9(R1)[5]。
历经5 年协调,E9(R1)于2019 年11 月正式定稿[6]。E9(R1) 的全称是《〈临床试验的统计学原则〉的增补:临床试验中的估计目标与敏感性分析》,其提出了一个结构化的框架,以确保临床试验的计划、设计、实施、分析和解释的协调一致。临床试验计划应按该框架的顺序进行,通过定义合适的估计目标,将明确的试验目的(trial objective)转化为关键的临床所关注的问题,然后选择合适的估计方法(estimator)。主估计方法(main estimator) 将以特定假设为基础。为了探索根据主估计方法所作推断对偏离其基本假设的稳健性,应针对同一估计目标进行一种或多种形式的敏感性分析。该框架有助于明确区分试验目的、估计目标、估计方法、估计值(estimate)和敏感性分析,进而有助于加强参与制定临床试验目的、设计、实施、分析和解释的多学科间的交流,并加强申办方和监管机构之间关于临床试验设计的适宜性和临床试验中治疗效应的沟通。
1.2 主要内容[6]
估计目标是对治疗效应的精确描述,反映了既定临床试验目的提出的临床问题。估计目标的构建包含5 个属性:①治疗(处理);② 人群;③ 变量( 或终点);④伴发事件(intercurrent events);⑤群体层面汇总。临床问题及与之相关联的估计目标,应当在计划临床试验的初始阶段予以明确。构建估计目标时,应该考虑在特定医疗环境下特定治疗的临床相关性,有必要清楚地了解相关临床问题所涉及的治疗,同时应讨论是否通过明确人群和变量(或终点)属性来说明相关临床问题的伴发事件,还应考虑试验实施的现状是否与所预期的临床实践相同。
伴发事件是指治疗开始后发生的事件,可影响与临床问题相关的观测结果的解读或存在。可影响观测结果解释的伴发事件包括终止所分配的治疗和使用额外的或其他治疗,如改变基础治疗或合并治疗、转组治疗;可影响观测结果存在的伴发事件包括终末事件,如死亡。在描述治疗效应时需要考虑伴发事件。
伴发事件的处理策略主要有以下5 个:①疗法策略(treatmentpolicy strategy),即无论是否发生伴发事件,均会使用相关变量的值;②假想策略(hypotheticalstrategies), 即设想一种没有发生伴发事件的情景,体现临床问题的变量值是在所假设的情景下采用的变量值;③ 复合变量策略(composite variable strategies), 即伴发事件本身可提供关于患者结局的信息,将其纳入变量的定义之中;④ 在治策略(while on treatment strategies), 即关注在伴发事件发生之前的治疗效应;⑤主层策略(principal stratum strategies),即认为目标人群是会或者不会发生伴发事件的主层,临床问题仅在该主层中与治疗效应相关。
对于给定的估计目标,应采用与其相一致的分析方法(或估计方法),使所得估计值可以支持对结果的可靠解读。该分析方法还应能计算置信区间并进行统计学显著性检验。基于特定估计目标的统计推断,应该对数据的局限以及主估计方法统计模型中假设的偏离具有稳健性。这种稳健性应通过敏感性分析来评价。应制定一个前瞻性计划收集详细的数据缺失的原因,以区分伴发事件的发生与缺失数据。因伴发事件变得无关(选择不收集或选择收集但不使用)的数据不应与未能收集到相关数据相混淆。这可使敏感性分析的选择更合理。
对于所有用于监管决策和说明书制定的估计目标的主估计方法,都应有相应的敏感性分析计划。除了主要分析和敏感性分析之外, 还可以对估计目标进行补充分析(supplementary analysis),但补充分析在解释试验结果方面的作用通常较小。
2、适用E9(R1) 前的准备工作
在E9(R1) 的Step 2b 阶段前夕,国家药品监督管理局药品审评中心(以下简称:药审中心)派员加入该指导原则的专家工作组(EWG)参与协调,并组织主办单位及外部协会成立了国内专家工作组,以便及时向国内反馈协调进展和收集国内的意见或建议。截至2019 年11 月, 该指导原则Step 4 阶段结束,药审中心EWG 专家共参与了4 次ICH大会(ICH Assembly Meeting)安排的EWG 会议和20 余次EWG 电话会议。
为了推动E9(R1)在我国的转化实施, 药审中心组织对E9(R1)进行翻译,并于2020年7 月16 日对中文翻译稿公开征求意见[7]。2020 年12 月8 日,药审中心正式发布该中文翻译稿[8],并对充分征求工业界意见后制定的E9(R1)转化实施建议公开征求意见[9]。2021 年1 月21 日,国家药品监督管理局发布了关于适用E9(R1) 的公告,要求自公告发布之日起,12 个月后启动的药物临床研究适用E9(R1)[4]。
为了加强监管机构、工业界和学界人员对ICH 技术指导原则的理解,药审中心于2021 年4月28 日举办ICH 指导原则实施情况宣讲会, 介绍了E9(R1)的技术要求和落地实施情况[10-11]。
为了适应近年来临床试验数据管理与统计分析技术及方法的不断发展,配合E9(R1)的落地和实施,药审中心组织修订了2016年7 月发布的《药物临床试验数据管理与统计分析的计划和报告指导原则》[12],形成了《药物临床试验数据管理与统计分析计划指导原则》。该指导原则于2021 年9 月面向社会各界征求意见[13],并于2021 年12 月正式发布[14]。
3、适用E9(R1) 的初步考虑
3.1 适用范围
虽然E9(R1)主要适用于确证性临床试验[6],但并不意味着早期或探索性临床试验不适用E9(R1)。在适用E9(R1)的前提下,制订确证性临床试验方案之前,需要对感兴趣的临床问题有充分探索,这样才能选择合理的试验目的和估计目标,同时需对在临床问题中反映的伴发事件的种类、原因、频次等有预估依据,以保证使用合适的处理策略来明确体现不同伴发事件的临床问题。早期或探索性临床试验的目的是为开展确证性临床试验提供初步证据[15],其在探索临床问题、试验目的、估计目标、伴发事件及处理策略等方面将发挥重要作用,因此鼓励早期或探索性临床试验也适用E9(R1)。
3.2 适用时限
2022 年1 月21 日后启动的药物临床研究适用E9(R1)[4]。对于2022 年1 月21 日前启动的药物临床研究,如果某项确证性临床试验在2022 年内尚不能用来申请注册,建议参照E9(R1)及时修订完善临床试验方案和(或)统计分析计划。主要考虑是,等到该试验最终完成并申请注册时,监管机构的审评人员已经习惯适用E9(R1)进行评价。
3.3 临床问题阐述
应对感兴趣的临床问题进行充分阐述,明确解释研究该临床问题的原因,以及说明研究该临床问题的重要性体现在哪些方面。提出感兴趣的临床问题应建立在早期或探索性临床研究的基础上,或者建立在循证研究的基础上,辅以对已发表文献的适当引用。对临床问题的描述,应尽可能清晰明确,以使监管机构、临床医生和患者等易于理解。
应先阐述感兴趣的临床问题,再确定试验目的和构建估计目标。试验目的和估计目标是对临床问题的反映和细化。正确的思考过程是,先明确需解决的临床问题,确定试验目的,然后考虑可能发生的伴发事件,讨论处理策略,再构建估计目标,最后选择合适的估计方法。
3.4 试验目的与估计目标
试验目的可分为主要目的、次要目的和探索性目的等,估计目标也可分为针对主要目的估计目标(主要估计目标)、针对次要目的估计目标(次要估计目标)和针对探索性目的估计目标(探索性估计目标)等。主要目的应该与感兴趣的临床问题保持一致,主要估计目标应是对主要目的的具体转化。如果设有关键次要估计目标,可将其置于一般次要估计目标之前进行描述。
在一个临床试验中可以有共同(co-primary)或多个主要目的,以及共同或多个主要估计目标,可以在单个主要目的下设置共同或多个主要估计目标,也可以有关键次要估计目标等。对此类情况需要考虑多重性问题。
3.5 估计目标构建
估计目标的属性包括治疗(处理)、人群、变量(或终点)、伴发事件、群体层面汇总。在描述估计目标的属性时,应按照以上属性次序进行描述,内容不要重复和交叉。
“治疗(处理)”属性应详细描述将用于比较的感兴趣的治疗(处理)或(视情况而定的)替代治疗(处理);对于多组研究,应详细描述每组的治疗(处理)方式以及组间的比较方式。“人群”属性应对研究人群进行充分和具体描述,包括疾病背景、主要特征等,而不是一般性描述,如“所有接受治疗的患者”或“所有随机化患者”。“变量(或终点)”属性应详细描述变量(或终点)的理论依据,其测量应是清晰、明确、定量的,与对应的试验目的直接相关。“伴发事件”属性应对可能发生的伴发事件进行定义,描述伴发事件的处理策略。“群体层面汇总”属性应规定变量(或终点)的群体层面汇总的统计量,为不同治疗(处理)之间的比较提供基础。
3.6 伴发事件及处理策略
“伴发事件”属性是构建估计目标的难点。一是,很难准确预估可能发生的伴发事件及其原因和频次等;二是,很难预先选择合适的处理策略。但该属性又至关重要。在临床试验过程中或者试验结束后,如果变更伴发事件和(或)处理策略,则可能导致预设的临床问题、试验目的和估计目标发生改变。
应通过早期或探索性临床研究或者循证研究事先了解可能发生的伴发事件的相关数据(如种类、原因、频次等),从而尽可能准确预估可能发生的伴发事件,并结合发生原因和频次等数据预先选择合适的处理策略。尤其是对于终止治疗,不同的受试者可能有不同的原因。若将其作为伴发事件,应根据其发生原因选择合适的处理策略。其发生原因不同,则处理策略可能不同。选择合适的处理策略的原则是尽可能符合临床实践情况且不夸大待评价药物的疗效。
申办方应在临床试验过程中收集所有可能发生的伴发事件的种类、原因、频次等数据,如果发现收集到的相关数据与预估数据不一致时,要及时与监管机构沟通对伴发事件及处理策略进行适当调整。监管机构在审评过程中将根据收集到的相关数据对预设的伴发事件及处理策略的合理性进行评价。若明显不合理,则会与申办方沟通对其进行适当调整。
3.7 样本量与分析集
样本量的确定应基于主要估计目标,以确保对主要估计目标的评价具有足够的检验效能。
分析集一般包括基于随机分组的分析集和安全性分析集。基于随机分组的分析集一般适用于人口学资料和基线特征的分析以及不同估计目标的评价;如果用于评价估计目标的人群不是该分析集的全部人群,则应在分析集中对这部分人群进行标记,并在临床试验方案和(或)统计分析计划中描述标记条件。安全性分析集一般适用于安全性分析。对于非随机化的临床试验可根据入组人群定义分析集。对分析集的描述应与估计目标的“人群”属性的描述保持一致。
3.8 估计方法
针对主要估计目标的估计方法可分为主估计方法和敏感性分析。针对次要估计目标和探索性估计目标的估计方法无需再区分主估计方法和敏感性分析。如果设有关键次要估计目标,可将其估计方法置于一般次要估计目标的估计方法之前进行描述。
在“主估计方法”的描述中,应阐明主要估计目标所涉及伴发事件的处理策略及相应的数据处理和分析方法,包括与伴发事件及处理策略直接相关的缺失数据的处理。此处应提供更多关于数据处理和分析方法的详细信息,避免与“估计目标”部分重复。应明确描述与伴发事件及处理策略直接相关的缺失数据的处理方法,其处理方法应基于临床上合理的假设,利用观察到的协变量和基线后数据进行填补。例如,在疗法策略下,如果认为伴发事件发生后停止治疗且未收集进一步数据的受试者,与伴发事件发生后停止治疗但数据收集仍在继续的其他受试者的数据分布相似的假设成立,对于前者,可能会使用基线协变量和来自后者的数据进行填补。
在“主估计方法”的描述中,应定义主要估计目标统计检验的原假设、备择假设及其检验水准等,说明评价主要估计目标所采用的统计分析方法,相应的统计模型的选择要注意考虑变量(或终点)的类型及其分布特征。治疗效应的估计应包括点估计和区间估计。
对于次要估计目标和探索性估计目标的估计方法,可参照“主估计方法”的描述方式。治疗效应的估计也应包括点估计和区间估计。如果次要估计目标设有假设检验,则应说明其原假设、备择假设以及检验水准等。如果无探索性估计目标,则无需描述其估计方法。
3.9 敏感性分析
针对同一主要估计目标,为了探索根据主估计方法得到的统计推断结果的稳健性,应进行一种或多种形式的敏感性分析。对于敏感性分析,同时变动主估计方法的多个方面假设可能难以确定由哪些假设导致了目前所观测到的潜在差异,因此应根据具体情况考虑是否需要同时变动多个假设进行敏感性分析,并阐明不同敏感性分析背后的假设变化。这将有助于对敏感性分析结果做出更合理解释。敏感性分析应与主估计方法一起事先规划。
对于预设的主要估计目标,其伴发事件和(或)处理策略的变更不是敏感性分析,因为伴发事件和(或)处理策略的变更意味着估计目标的改变。
3.10 缺失数据处理
应将缺失数据与不存在的数据或因伴发事件而被认为没有意义的数据区分开来,前者需处理,后者无需处理。也应区分与伴发事件及处理策略直接相关的缺失数据(如在疗法策略下,终止治疗后应收集但未被收集到的数据),以及与估计目标直接相关但与其伴发事件及处理策略不直接相关的缺失数据(如当直接退出研究未被预设为伴发事件时)。前者的处理方法应在“主估计方法”部分进行描述,后者的处理方法应在“缺失数据处理”部分进行描述。缺失数据处理应基于临床上合理的假设。
3.11 其他方面
除了主估计方法、敏感性分析等分析之外,还可以对估计目标进行补充分析,以提供对治疗效应更全面的了解。补充分析可针对主要估计目标,也可针对次要估计目标和探索性估计目标。补充分析在解释试验结果方面的作用通常较小,因此需要考虑补充分析的必要性和作用。
应参照E9(R1)中文翻译稿中的术语在临床试验方案和统计分析计划等资料中规范使用E9(R1)专有词汇的中文术语。
4、讨 论
在2017 年11 月Step 2b阶段发布E9(R1)征求意见稿后,该指导原则已经开始逐步得到关注[16-18]。2019~2021 年, 对该指导原则的研究主要集中在:①在不同适应症(如糖尿病、鼻息肉、类固醇减少、肿瘤或体重管理)的临床试验中如何构建和评价估计目标[19-23] ;②在不同研究设计(如等效性/ 非劣效性)的临床试验中如何构建和评价估计目标[24-25] ;③在不同终点类型(如均值比、信息截尾或生存结局)的临床试验中如何构建和评价估计目标[26-28] ;④因果推断框架与估计目标框架之间的关系[29-30] ;⑤如何适用估计目标评价COVID-19 流行对临床试验完整性和可解释性的影响[31-33] 等。这些研究的观点只代表了研究者个人对适用E9(R1)的理解,其合理性有待在实践中进一步验证。
目前,ICH 官网(有效性指导原则)显示,除了我国之外,全球已经适用E9(R1)的国家或地区还有瑞士(2019 年11 月30 日)、加拿大(2020 年7 月21 日)、欧盟(2020 年7 月30 日)、美国(2021 年5 月11 日)、韩国(2021 年11 月1 日)等,但迄今为止对适用该指导原则的实践经验都较为有限。在正在协调的M11(《临床电子结构化协调方案》)议题中,已经考虑将E9(R1)的相关内容融入标准化的临床试验方案模板和技术规范中。因此,在现阶段尚无适用E9(R1)的标准操作文件。
基于上述背景,虽然药审中心在适用E9(R1)前做了大量的准备工作,但由于尚缺乏充分的实践经验和足够的经典案例支持,因此本文只能在该指导原则的关键方面进行原则性阐述,暂时无法从研究设计、适应症、终点类型、因果推断等较为具体的方面对构建和评价估计目标的考虑进行更深入的阐述,也无法从标准操作层面提供全面系统的指导。即使如此,囿于经验,本文所述观点仍可能存在偏颇之处,有待与工业界和学界进一步交流和探讨。
鼓励申办方在适用E9(R1)时积极与监管机构进行沟通交流,具体问题具体分析。也希望工业界和学界不断对适用E9(R1)的实践经验进行归纳总结。随着实践经验的不断积累和经典案例的不断出现,我们对适用E9(R1)的考虑将越来越成熟、全面和系统。
来源:中国食品药品监管杂志