摘要
随机对照试验(RCT)被视为药械临床疗效评价的“金标准”。但针对罕见、重大且无有效治疗方式等疾病,考虑伦理、成本等因素,RCT并不适宜。此时,采用真实世界数据(RWD)作为试验的外部对照支持药械临床评价,可降低患者招募难度、缩减研发时间及成本。本文基于国内外最新发布的RWD有关的指导原则,并结合团队前期研究经验,介绍了采用RWD作为外部对照用于支持药械临床评价的常见应用场景、数据来源、研究设计、外部对照选择基本原则和统计分析方法,以期为相关学者、申办方开展RWD研究提供参考与借鉴。
随机对照试验(randomized controlled trial,RCT)通过严格筛选受试者、设置可比对照等措施控制多种偏倚,被视为评价药械临床疗效的“金标准”。但针对某些罕见病或严重危害健康且无有效治疗手段的疾病,出于伦理、时间及成本的考虑,RCT难以实施。由此,开展非随机的单臂试验吸引了业界的注意。单臂试验当前主要应用于具有某种特殊生物标志物的肿瘤、罕见病和其他难治性疾病中,以上领域急需有效的治疗措施,但目标人群有限,无法获得充足的样本以分配至对照组,且设置对照组有悖伦理。将全部受试者分配至试验组,符合受试者利益的考虑,还可观察长期的安全性和有效性。目前基于单臂试验获批的产品数量正逐渐增多,包含多种抗肿瘤治疗药品(如特瑞普利单抗、伏美替尼、普拉曲沙等)及医疗器械。
为进一步提高单臂试验的决策能力,临床医生、试验方法学家、监管机构及卫生技术评估(Health Technology Assessment)组织等认为可以采用外部对照,以提高药械临床评价结果的质量。利用包括常规观察性研究、患者登记、医院电子病历等多种来源的真实世界数据(real world data,RWD)为单臂试验提供对照。该模式突破了罕见病或难治性疾病等相关试验不便设置对照的限制;相较于RCT,基于RWD的外部对照研究降低了招募难度,缩减了研发时间及成本,有利于加快药械审评、审批。
为规范RWD的应用、支持真实世界证据(real world evidence,RWE)用于药械审评、审批决策,美国食品药品监督管理局(Food and Drug Administration,FDA)和欧洲药品管理局等监管部门相继发布了政策框架和指导原则。我国监管部门亦发布了相关技术指导原则,以支持RWE用于上市前审评、审批及上市后监管决策,并明确了RWE用于支持药械研发与审评的应用场景,其中一个重要场景即RWD可作为单臂临床试验的外部对照。笔者在现有指导原则的总体框架基础上,基于博鳌乐城特许药械RWD项目(如氟轻松玻璃体内植入剂、青光眼引流管等项目)的研究实践,探讨RWD作为临床试验外部对照的关键考虑,以期更好地促进基于RWD为外部对照的药械临床评价研究实践。
1、RWD作为外部对照的适用场景
基于我国监管部门、FDA等发布的指导原则及相关文献,总结RWD作为临床试验外部对照的常见场景,包括但不限于以下情形:
1.1医疗器械产品研发:
FDA发布的《使用真实世界证据支持医疗器械的监管决策》指出,当申报产品属于新型医疗器械,或与国内已上市同品种产品存在差异,或已有数据不能证明申报产品符合医疗器械安全和性能的基本原则时,需要开展临床试验,此时可利用已有RWD作为补充,与申报产品的试验数据进行对比分析,以支持申报产品的临床评价[]。
1.2治疗罕见疾病的药品临床评价:
因罕见病患者稀少且多为儿童患者,实施RCT存在招募困难,且受伦理限制。FDA发布的《罕见病:药品研发自然史研究指南》提出,可采用电子病例系统、登记研究数据、自然人群队列等所积累的同类患者群体的RWD作为外部对照,增加受试者样本量,降低试验招募难度。
1.3治疗危及生命且缺乏有效治疗措施的重大疾病的创新药械临床评价:
在该情景下,治疗选择有限,且存在伦理问题,随机化并不行,亦可选择电子病例系统、患者登记数据库等的RWD作为外部对照进行单臂试验,或补充RCT中的样本量有限的内部对照,增加研究效能。
1.4特许药械临床评价:
博鳌乐城国际医疗旅游先行区基于特许政策,开展临床急需进口医疗器械和药品的特许医疗,通过系统收集临床实践中产生的RWD,形成支持特许药械注册的临床证据;此时可采用基于RWD的外部对照数据,与乐城特许药械产生的RWD进行对比分析,支持特许药械临床评价。
2、RWD作为外部对照的来源和方式
作为外部对照的RWD通常来源于医院信息系统数据、医保支付数据、登记研究数据、自然人群队列数据、死亡登记数据、电子医疗设备数据等。保证其数据质量是开展研究的基础,也是产生高质量证据的前提。首先需要保证数据的相关性,即是否满足研究目的;在此基础上,还需保证数据的可靠性,可对数据的准确性、一致性和完整性等方面进行评价。
依照数据采集的时间可以将RWD作为外部对照的方式分为历史对照、平行对照和双向性对照,平行对照的采集时间与当次试验时间相同,历史对照采用既有数据,双向性对照主要适用于研究开始时仅有部分数据满足要求,仍然需要前瞻性采集数据。考虑到时间推移可能导致疾病在诊断、治疗等方面发生变化,而引入多种偏倚(如错分偏倚、时间偏倚、诊断偏倚等),改变、模糊或夸大真实效应量,建议采用平行对照。
3、RWD作为外部对照的研究设计
依照试验是否存在内部对照,可以将RWD作为外部对照的设计分为两类:增补单臂试验和增强RCT。增补单臂试验指单臂试验中,仅利用RWD作为外部对照与试验组比较。由于对照组与试验组的来源不同且非随机化,增补单臂试验的证据等级较“金标准”RCT低;但相较于单臂试验,增补单臂试验更易反映出试验组的安全性和有效性。增强RCT则指RCT中已存在内部对照,但试验组人数多于对照组人数(即常见的N∶1随机设计,如针对缺乏有效治疗措施的罕见病,考虑伦理等因素使更多受试者分配到新疗法而获益),同时选用RWD作为外部对照与内部对照共同构成新的对照组,与试验组进行比较。
4、RWD作为外部对照的基本原则
根据试验设计的要点,外部对照的选取应重点考虑:
①人群:根据试验目的及试验组的受试人群,明确外部对照患者的纳入/排除标准,控制选择偏倚;
②暴露/干预:依据外部对照中暴露/干预的相关变量(包括方式、强度、时长等),明确其测量方法,控制信息偏倚;
③结局:明确外部对照结局的随访时间、测量方法等特征,保证与试验组一致的结局定义,确保数据的真实性和完整性,避免信息偏倚;若存在数据缺失,应基于不同的缺失类型假设,选择填补方法,并进行敏感性分析;
④混杂:RWD需具备尽可能详细、量化的协变量信息,明确可能对暴露/干预或结局产生重要影响的因素及其测量方法;同时RWD存在大量时依混杂因素,应尽可能识别与研究相关的时依混杂变量,并采用统计方法如G-method和边际结构模型等加以控制;
⑤时间:随着整体卫生保健水平的改善,疾病筛查、诊断、治疗、护理等标准发生变化,采用过去随访的患者数据可能引入多种因时间差异引起的偏倚。
5、RWD作为外部对照的统计分析方法
RWD作为外部对照的关键点之一在于选择合适的统计分析方法对RWE和试验证据进行整合与分析,目前常用的方法包括基于频率学派的倾向性评分分析和基于贝叶斯学派的动态借用模型等。
5.1倾向性评分:
传统研究首先通过logistic回归分析等方法计算倾向性评分,再依据倾向性评分建立与试验组可比的外部对照组,包括匹配、分层、逆概率加权等方法。然而,这种传统方法仅适用于试验组与单一外部对照的比较,不适用于存在多个对照组的情形,如已存在样本量较小的内部对照,利用RWD作为外部对照补充证据时,该方法存在局限性。为此,Stuart和Rubin对传统方法进行了扩展,使其适用于外部对照与内部对照同时存在的情形,扩展倾向性评分研究的主要思想是为每一个试验组患者匹配到一个内部对照或外部对照;并定量估计外部对照偏倚的大小和方向;结合匹配结果与偏倚程度,估计干预/暴露的平均效应。
主要通过以下步骤实现:
①内部对照与试验组匹配,为每个内部对照患者匹配一个试验组患者;
②外部对照与试验组匹配,为未匹配到内部对照的试验组匹配外部对照;
③内部对照与外部对照匹配,为内部对照匹配外部对照,基于匹配结果,通过线性建模等方式评估内、外部对照效应值间的差异(即外部对照的偏倚程度);再依据该模型调整外部对照的效应值;
④基于试验组与内部对照的匹配组、试验组与调整后外部对照的匹配组,估计干预/暴露的平均效应。
该扩展分析可为试验组匹配可比的RWD外部对照,补充了对照组数据,提高了检验效能。因此,该方法可用于解决因招募困难或伦理问题导致的内部对照样本量不足的问题。
5.2动态借用模型:
倾向性评分法利用外部对照的全部信息进行分析,但现有研究认为RWD的研究结果存在不同程度的偏倚,认为应慎重合并RWD。因此,降低RWD在合并时的权重是可行方案之一,可基于贝叶斯框架实现,常称为贝叶斯动态借用模型。其基本过程是将RWD转化为先验信息,再与RCT内部对照合并,估计后验分布,常用方法有层次Meta分析模型(hierarchical Meta analytic model)、稳健Meta分析预测先验(robust Meta-analytic-predictive prior)、共识性先验(commensurate prior)及幂先验(power prior)等。
层次分析模型通过Meta分析预测先验将多来源的RWD建立为先验,并依据内部对照与外部对照的可交换性,决定利用外部对照的程度。稳健Meta分析预测先验是在Meta分析预测先验的基础上,新增了另一先验组分进行动态调节,避免后验分布出现较大波动,使结果更加稳健。而共识性先验则假设外部对照是内部对照的非系统有偏版本,通过方差参数调节偏倚程度:方差越小,说明两种对照间偏差越小,可借用外部对照信息更多。幂先验通过估计权重参数,决定外部对照的利用程度,存在较多扩展类型,包括标准化幂先验(normalized power prior)、共识性幂先验(commensurate power prior)、部分借用幂先验(partial borrowing power prior)、部分折扣幂先验(partial discounting power prior)等[]。有研究认为,除非给予权重参数强烈的先验,否则该方法可能对外部对照“大打折扣”]。
5.3敏感性分析:
各方法的使用均存在假设条件,因方法选择或参数设置的不同,结果的不确定性较大。难以测量或未考虑的混杂因素也会导致结果出现偏倚。为了进一步评估结果的稳健性及偏倚程度,敏感性分析必不可少。
在选择与试验组可比的外部对照时,除利用倾向性评分进行匹配,还可选用分层、加权等方法,评估结果的稳健性;同样,利用贝叶斯动态借用模型可选择不同的先验设置方法,评估其对结果的影响。各方法的参数包括倾向性评分的卡钳值、贝叶斯动态借用模型的权重参数、先验分布等,设置时可能存在一定的主观性,进而影响匹配结果或外部对照的利用程度,可以通过设置多样化参数评价结果的稳健性。以上从方法选择和参数设置层面,可以反映出敏感性分析在可识别、可测量的混杂中的结果。
此外,利用RWD作为外部对照还可能产生其他未识别的偏倚,包括选择偏倚、信息偏倚和混杂偏倚等[]。利用定量偏倚分析(quantitative bias analysis,QBA)技术可以估计潜在偏倚的大小和方向,并量化这些偏倚的不确定性,常见技术包括简单敏感性分析(simple sensitivity analysis)、多维分析(multidimensional analysis)、概率偏倚分析(probabilistic bias analysis)和多偏倚模型(multiple bias modelling)等。由于QBA的计算量会随参数的增多而显著增加,因此确定研究关注的偏倚十分必要。QBA的另一种形式是无效分析,如常见的E值,用于估计抵消观测效果所需的偏倚强度,若需极大的偏倚才能导致研究结果的方向和大小发生改变,且该强度的偏倚并不合理,则可认为研究的偏倚风险很小。
6、RWD作为外部对照的研究实例
本文以示例展示RWD作为单组试验外部对照的要点。间变性淋巴瘤激酶(ALK)作为一种生物标志物,在非小细胞肺癌(NSCLC)患者中比较罕见,患者总体数量较低;此外,ALK抑制剂的治疗策略高度细分、复杂多样。研究比较阿来替尼与色瑞替尼治疗ALK+NSCLC患者的疗效,但因患者数量和伦理的考虑,难以开展传统RCT。最终该研究拟开展单臂试验(ALK标志物阳性的NSCLC患者接受阿来替尼治疗),并使用RWD作为外部对照(ALK标志物阳性的NSCLC患者接受色瑞替尼治疗),以提高证据强度。2017年底阿来替尼治疗ALK标志物阳性的 NSCLC获FDA批准上市。该研究主要关键点:
6.1选择作为外部对照的数据库:
该研究选择了Flatiron电子健康记录(EHR)为外部对照的来源,提取患者个体水平数据。该库是大型的肿瘤数据库,涵盖病例数量多、变量丰富,可以满足对研究对象的选择;且数据具备严格的质量控制程序,可以保证数据的真实性。
6.2选择与试验组可比的外部对照:
①受试人群:选择ALK标志物阳性的NSCLC患者,符合试验组的纳入/排除标准;
②干预:接受色瑞替尼治疗;
③结局:选择“硬终点”总生存期为主要结局,死亡数据的收集不易受其他主观因素影响;
④混杂:控制与干预或结局相关的基线协变量,包括年龄、性别、种族、疾病阶段、既往治疗路线等。
6.3采用倾向性评分研究均衡两组研究对象的混杂因素:
针对上述混杂因素,采用倾向性评分逆概率加权法,分别对试验组和外部对照组的主要结局进行合并,以控制混杂偏倚。调整前,两组患者的年龄、性别、种族、既往治疗等基线情况并不可比,经倾向性评分逆概率加权后,所有协变量的标准化均数差较小,实现均衡。
6.4主要统计分析方法:
研究采用Kaplan-Meier法和多变量Cox比例风险模型比较两组生存时间及死亡风险。结果显示:试验组的中位生存时间长于外部对照组,且死亡风险低于外部对照组。
6.5敏感性分析:
主要通过控制其他可能的混杂因素、填补缺失值进行敏感性分析。所有敏感性分析的结果与主要分析一致,验证了研究结果的稳健性。
7、总结
RWD作为药械临床评价的外部对照,可为监管决策提供进一步的证据支持。为解决研究问题、保证结果真实可靠,应对外部对照数据的来源、构建和分析采取较严格的措施,详细且透明地选择出外部对照,最大限度地减少偏倚和混杂。良好的顶层设计、高质量的外部对照数据、严格的统计分析方法,是基于RWD的外部对照提供可信、可操作和可重复临床证据的关键环节。