摘要
目的:分析药物临床试验现场核查过程中疗效指标相关问题的关注点,为药物临床试验现场核查工作提供参考。方法:参考国内外药物临床试验实施和检查相关指导性文件,对疗效指标相关核查要点进行总结;并结合近年来现场核查经典案例,梳理核查过程中不同试验设计的药物临床试验常用的疗效评价指标及对应的常见问题,分析现场核查的关注点。结果:通过案例分析,明确了疾病临床终点或相关重要临床事件类疗效指标、量表类疗效指标、实验室检测结果类疗效指标、影像学结果类疗效指标4类常用疗效评价指标的现场核查关注点。结论:不同类型的疗效指标具有不同的评估要求、评估标准和评估流程,现场核查过程中应有针对性地考虑适当的关注点,才能使核查工作更加高质高效地开展。关键词:药物临床试验;疗效指标;现场核查;疗效评估
药物临床试验是确认药物有效性和安全性的关键环节,对探究药物在体内的生理药理特性、明确适用人群和评价治疗作用具有十分重要的意义。为确保临床试验数据的真实、科学和可靠,充分保证上市药品的安全有效,国家药品监督管理局食品药品审核查验中心于2015年10月启动现场核查工作,对临床试验现场进行实地确证,对临床试验原始记录进行现场核查。在现场核查过程中,疗效指标相关问题事关药物临床试验的有效性评价,既是核查的重点,也是核查的难点。本文对药物临床试验疗效指标相关核查要点进行总结,梳理常见的疗效评价指标,结合典型案例分析现场核查关注点,旨在为同行提供参考,促进我国药物临床试验现场核查工作更加高效有序地开展。
一、物临床试验现场核查实施情况
药物临床试验现场核查是药品注册研制现场核查的一部分,是对注册申报资料中的临床试验实施情况进行实地检查、核实。主要依据《药品注册管理办法》《药物临床试验质量管理规范》《药品注册核查要点与判定原则(药物临床试验)(试行)》[1](以下简称“核查要点”)等法律、法规或规范要求,对临床试验的许可条件、伦理审查、实施过程、试验用药品管理、生物样品管理、中心实验室及独立评估机构、数据采集记录等方面进行核查。药物临床试验现场核查工作由国家药品监督管理局食品药品审核查验中心组织全国药品检查资源实施。
鉴于有效性评价在临床试验实施和核查过程中的重要作用,笔者结合多年工作经验及现场核查实际,以现行法规文件和核查要点为指导,分析药物临床试验现场核查中疗效指标方面的常见问题及关注点。
二、现行《药品注册核查要点与判定原则(药物临床试验)(试行)》涉及疗效指标的核查要点
我国现行核查要点于2021年12月17日由国家药品监督管理局食品药品审核查验中心发布,自2022年1月1日起施行。核查要点包含八个部分共48条,涉及疗效指标的要点在多个部分均有提及。事实上,由于疗效指标的评价是药物临床试验实施的关键环节,对药品有效性的确定具有重要作用,其记录、溯源、评估等要求贯穿于核查要点的各个环节。根据核查要点总结疗效指标应在如下几个方面重点关注。
2.1 疗效指标的记录
数据记录是疗效评估的基础。研究者应按照临床试验方案规定的流程和评估方法实施试验,采取措施保证关键步骤实施的准确性,并保存相关记录,记录修改应留痕,不掩盖初始数据并保存修改轨迹,注明修改理由,由修改者签名确认并注明日期。
2.2 疗效指标的评估
基于核查要点,疗效指标的评估可分为以研究者或独立评估机构的评估结果作为有效性数据、以临床机构检验科或中心实验室的检验结果作为有效性数据和以受试者自评结果作为有效性数据等多种情况。不同适应症的药物临床试验疗效指标的选择往往差异较大。笔者结合检查工作经验并检索药物临床试验登记与信息公示平台,发现95%以上的抗肿瘤药物临床试验以研究者或独立评估机构的评估结果作为主要终点,80%左右的神经精神类药物、风湿免疫类药物、皮肤病相关药物以受试者自评结果作为疗效指标之一,而多数代谢疾病相关药物的疗效指标则常以实验室检测结果为主。
以研究者的评估结果作为有效性数据的,该研究者应具有相应的教育、培训和经验,并得到主要研究者的授权,其评估数据的记录和修改应符合临床试验数据记录的相关要求。
以独立评估机构的评估结果作为有效性数据的,其评估人员应具备相应资质,评估流程、数据记录及修改应按照相关指南和独立评估机构的章程、标准操作规程执行。
以临床机构检验科的检验检查结果作为有效性数据的,其临床实验室应参加经国家卫生健康部门认定的室间质量评价机构组织的临床检验室间质评并取得通过证书,且对临床检验相关检验仪器、辅助设备等定期校准。
以中心实验室的检验结果作为有效性数据的,中心实验室除应通过国家级室间质评并做好仪器设备的使用、维护、校准外,还应建立临床检验报告发放制度(包括危急值报告制度),按照相关要求向研究者报告检验结果,保证检验报告的准确性、完整性和及时性。
2.3 疗效指标的溯源
经研究者或独立评估人评估得出的有效性数据应溯源至评估人、评估时间、原始评估结果及其修改过程,独立评估结果还应溯源至每位独立评估人员独立出具的评估报告。
以临床机构检验科或中心实验室的检验结果作为有效性数据的,应可在其LIS系统或仪器设备中溯源。
以受试者自评结果作为有效性数据的应溯源至有受试者署名确认的原始评估记录,包括受试者日记卡、受试者评估报告等。
三、药物临床试验常见疗效指标及关注重点
有效性是药物批准上市的前提和基础,不同试验目的、不同适用人群、不同给药途径、不同试验设计的药物临床试验,其选择的疗效评价指标往往不同。
疗效指标是反映药物作用于受试者所表现出的有效性的主要观测与评价工具,具体应包括疗效观测指标、收集方法和评价标准等。疗效观测指标可以是疾病临床终点、影响疾病进程的重要临床事件,也可以是反映患者社会参与能力、生存能力、临床症状和/或体征、心理状态等内容的相关量表或其他形式的定量、半定量或定性的指标;也可以是通过某些医疗仪器和设备测量手段获得的数据或检查结果,主要包括影像学、病理、生化等指标[2]。不同类型的疗效指标,有不同的观测、收集和评价方法,本文仅针对药物临床试验设计和实施过程中常用的疗效指标进行讨论。
3.1 疾病临床终点或相关重要临床事件类疗效指标
疾病临床终点指标一般是指反映患者疾病的最终结局或影响患者生存的严重疾病状态等特征的指标[3],如抗肿瘤药临床试验的总生存期(OS)、某些重要临床事件如脑卒中、急性心梗、骨折的发生情况等。但由于该类指标作为疗效评价时临床试验的观察周期往往较长、所需样本量大、研究成本较高,目前多采用其他可测量或易于观测的替代性指标,以增加临床试验的可操作性。采用疾病临床终点或相关重要临床事件作为疗效指标的,应关注其判断标准是否清晰明确,如住院标准的判断、死亡原因的判断等,同时应关注相关记录是否保存完整、可追溯。对于多中心临床试验,尽管方案中规定或者国内外有明确的公认的诊断标准,不同研究者仍可能在判断上存在不同认识,通常可以设立独立的终点仲裁委员会,以降低不同研究者评判差异造成的偏倚,增强临床事件判断的可靠性。
常见问题举例:某临床试验主要疗效指标为OS,现场检查发现一定比例的受试者未收集死亡证明,仅在门诊病历本的电话随访记录中记录电话联系日期、受试者家属告知的死亡日期等,不能保证有效性数据的可靠性。该项问题的出现可归因于研究者对OS和源数据的认识有欠缺,随访记录内容过于简单,可靠性差。OS是国际公认的肿瘤临床试验疗效评价的金标准,OS的可靠性高度依赖受试者死亡时间的准确性。记录在门诊病历中的电话随访情况过于简单,缺乏必要的信息要素,不足以作为反映受试者死亡时间的原始文件,不能保证时间的准确可靠。该专业最终因该项问题涉及数据可靠性被国家药品监督管理局发文整改。针对类似问题,建议研究者正确理解OS作为主要疗效指标对数据记录准确性的要求和源文件、源数据的涵义,尽量收集受试者家属提供的死亡证明如医疗机构签发的死亡证明、电子病历中记录的死亡时间或公安系统签发的死亡证明等,如采用随访记录的方式,应尽可能包括随访日期、方式、人员、受试者生存状态、死亡日期、死亡原因、死亡地点等信息要素,保证记录的标准统一,以提高数据可靠性[4]。
3.2 量表类疗效指标
量表是药物临床试验中应用较普遍的评价工具,可适用于入排标准的判断、不良事件的监测、疗效指标的评价等。作为疗效指标的量表以评价人员进行划分可以分为患者报告的结局(PRO)量表和临床医生观测的量表等。
3.2.1PRO量表
以患者自我感受为疾病变化指征的药物临床试验多采用PRO量表,以评价患者自觉性症状或功能能力的变化,如疼痛、瘙痒、失眠、疲劳、抑郁、生活质量或对日常生活和心理状态的影响等[5]。常见如疼痛相关临床试验最常使用VAS和数字疼痛评分量表,精神健康类临床试验多使用汉密尔顿抑郁量表、匹兹堡睡眠质量指数,神经病学相关试验侧重使用VAS和欧洲生活质量-5维量表等。在使用PRO量表前,应对受试者进行培训,确保其能够正确理解并准确填写量表,且应制定有效措施防止出现补填行为。在随访过程中,也应注意对受试者依从性的评估和量表填写的再培训,以充分保证评估结果的可靠性。
常见问题举例:某临床试验主要疗效指标为评分刻度表,方案规定由受试者根据自身感觉在评分刻度表上划记号表示,但现场核查中未见原始评分刻度表。该试验是以PRO量表为主要疗效指标的典型案例,受试者依据自身感受转化形成可量化的数字化指标作为评估标准,其数字化来源的第一手资料至关重要。缺少原始评分刻度表,导致用于评价的数据不能溯源,不能保证数据真实反映受试者自身感受,最终影响疗效评价的可靠性。该项问题在现场核查中被建议作为审评重点关注问题。针对类似问题,建议研究者认真培训受试者按照标准操作流程完成疗效相关评价并完整保存原始记录,确保源文件、总结报告、统计分析报告和数据库中的疗效指标相关数据一致。
3.2.2临床医生观测的量表
临床医生观测的量表是基于有医疗专业背景的医生对患者的健康状况观察后进行的评估报告,包括医生观察到的患者的症状、体征及其他结果[6]。不同的观测量表对使用人员有不同的资质要求,有的量表甚至需经过资格认证并取得资格证书后方可使用。临床医生观测的量表常见于皮肤疾病、免疫疾病、神经精神类疾病等相关试验,由于此类量表评估易受研究者主观影响,通常试验设计为双盲试验,应关注临床试验过程中盲态的保持情况,如试验药物和对照药物因外观存在差异而必须设置非盲团队时,应重点关注非盲操作流程设计是否合理,是否存在破盲风险,从而对疗效评估结果产生影响。
常见问题举例:某临床试验主要疗效指标为皮损部位评分量表,1例受试者未现场访视,由研究者依据该受试者皮损部位照片进行评分,不能准确反映皮损部位的浸润、脱屑等表现;某临床试验主要疗效指标为研究者评估的量表,试验采用盲法设计,根据试验方案,配药环节应为非盲人员,主要研究者未授权非盲配药人员,配药人员实际参与注射给药,存在破盲风险。上述两项问题均可归结于临床试验过程中产生了偏倚,影响有效性结果的评估。以皮损照片代替现场访视,不能完整展现皮损全部特征,评估结果准确性大打折扣;破盲风险可能导致主观选择偏倚,试验均衡性出现差异,还会导致研究者对治疗的态度及疗效评价呈一定倾向性,受试者对治疗的配合及心理作用产生干扰,均会影响试验结果的准确性。因该项目存在破盲风险申办者经过综合评估后未使用该中心试验数据进行注册申报。针对以研究者或受试者评估结果作为主要疗效指标的试验,建议尽可能采取措施减少或避免来自研究者或受试者的主观偏倚,使疗效评价更加科学、客观、可靠。
3.3 实验室检测结果类疗效指标
实验室检测结果因其客观性和准确性经常作为药物临床试验的疗效评价指标,一定情况下甚至可作为主要疗效指标,在有效性评价中发挥关键作用。此类指标常见于心血管疾病、内分泌代谢性疾病相关的药物临床试验,如糖尿病相关临床试验的主要疗效指标多为糖化血红蛋白、动脉粥样硬化相关临床试验疗效指标多为低密度脂蛋白胆固醇降低值和降低百分率[7]、骨质疏松相关临床试验疗效指标常见骨转换指标等。以实验室检测结果作为疗效评价指标时往往需要与基线检测结果进行比较,而这些指标往往会受到生活方式、饮食习惯、睡眠状况、心理因素和其他临床干预等多种因素的影响。因此,该类药物临床试验在设计上往往会增加导入期或洗脱期,使受试者达到稳定的基础状态和用药剂量水平,以消除其他因素对药物有效性评价的干扰。
为降低不同实验室检测结果的差异和偏倚,以实验室检测结果作为疗效评价指标时多设置中心实验室进行统一样本检测,此时应关注生物样本的采集、处理、保存、运输、检测等样本管理的各个环节是否符合试验方案和实验室手册的要求,原始记录是否完整,样本数量是否核对一致,检测结果是否可溯源。对于多中心临床试验尤其国际多中心临床试验以中心实验室检测结果作为疗效评价指标的,还应注意检测结果的计量单位和正常值范围是否存在较大差异。
常见问题举例:某临床试验疗效指标为基于中心实验室检测结果的计算值,核查发现其原始数据与数据库及总结报告数据不一致。统计人员通过对数据库中数据的统计分析,评价试验用药品的有效性,而数据库中的数据来源于试验过程中的原始文件,因此,确保原始数据与数据库、统计报告和总结报告中的数据一致至关重要,既是研究者履行质量管理职责的重要环节,也是现场核查过程中的关注重点,尤其针对以实验室检测结果作为主要疗效指标的试验。当然,基于该项问题还应结合不一致数据的占比综合评估对疗效指标的最终影响。针对此类问题,研究者应保证将数据及时、准确、完整地录入原始病历和数据库中,不得随意更改,确有明确原因需更改的,应按照GCP规定的修改要求,保持初始记录清晰可辨,保留修改轨迹,必要时注明修改理由,并由修改人签署姓名和日期。
3.4 影像学结果类疗效指标
影像学指标广泛应用于抗肿瘤药相关的药物临床试验,如无进展生存期(PFS)、无病生存期(DFS)、客观缓解率(ORR)、疾病控制率(DCR)等抗肿瘤药临床试验中常见的替代指标的评估均依赖于影像学结果。使用影像学结果作为疗效评价指标时,可参考FDA发布的《临床试验影像终点过程标准行业指导原则》(Clinical Trial Imaging Endpoint Process Standards Guidance for Industry)的相关要求,国家药品监督管理局药品审评中心也发布了《抗肿瘤药临床试验影像学评估程序标准技术指导原则》[8]供行业参考。
以影像学结果进行疗效评价的,应在试验方案中明确具体评价标准,通常应选用国内外行业内公认的评价标准,如目前实体瘤常用的评价标准为RECIST 1.1,淋巴瘤常用的评价标准为lugano等。无论基于何种标准,靶病灶和非靶病灶的选择尤为重要。应关注选择的靶病灶是否可测量、大小是否合适、边界是否清晰、有无与其他组织腺体相融合;非靶病灶选择是否合理等。为保证前后测量的可比性和准确性,整个试验过程中应尽可能保证扫描方式一致,如不要由CT变更为MRI等。为保证评估结果的可追溯性,还应尽可能记录测量靶病灶选择的图层、测量方式(是否进行重建)等。
通常情况下,为保证评估的客观性和独立性,往往设立独立影像评估委员会(IRC)并采用其评估的结果作为主要疗效指标,辅以研究者评估结果作为次要疗效指标。IRC应确保评估人员具有相应的资质、接受过系统的培训,并采取适当措施保证评估独立性。当不同评估人员的评估结果出现不一致时,还应设置裁判阅片人进行仲裁。有时因评估标准要求结合临床数据作为参考,还会设置疗效评估人员进行临床疗效评价。以IRC作为疗效评估的,应关注评估流程的合理性、影像学图像是否隐去受试者个人信息以消除评估偏倚,还应关注IRC评估结果与研究者评估结果是否存在明显差异。早年间因无相应的指导原则,无官方推荐的统一评估标准,部分临床试验还存在IRC集体讨论做出评估结果的方式,影响评估的独立性,进而影响有效性数据的可靠性。
常见问题举例:某临床试验使用IRC进行影像学评估,IRC通过圆桌会议方式对每一位受试者的影像学资料共同审核,不能保证评估的独立性。IRC的独立性是药品审评部门关注的重点,多名评估者通过会议方式评价目标病例,将难以避免讨论会影响单个评估者的独立判断,可能导致主要疗效指标结果不可靠。该项问题在现场核查中被建议作为审评重点关注问题。使用IRC进行影像学评估且以其评估结果作为主要疗效指标时,要根据目标适应症特点、试验设计和实际实施因素考虑评估流程设计,避免因评估流程存在的科学性问题而导致评价结果发生系统性偏倚[8]。
四、讨论
药物临床试验现场核查是药品全链条监管的重要手段,既能保证临床试验数据的真实可靠,从源头上保障药品安全有效,又能保护受试者安全和权益,在过程中控制临床试验质量风险[9]。临床试验的有效性数据是药品上市的重要支撑,也是药品审评审批的关键内容。在核查过程中发现疗效指标相关问题时,一方面应评估问题出现的具体环节,如评估、记录、溯源等,核实问题产生的原因,并及时将原始记录与数据库进行比对,还原数据产生的过程,判断数据库的录入和上报是否准确无误,符合要求;当数据出现大量修改时,还应核实修改依据是否充分合理,是否具有一定倾向性,必要时还应剔除具体数据作敏感性分析;核实数据库的锁定时间是否符合逻辑,如有开库痕迹,核实开库原因,是否有相应的文件记录等。另一方面,应收集汇总出现相同情况的受试者例数、组别(试验组或对照组)及所占比例,综合判断其对临床试验疗效评价结果的影响。
综上,疗效指标是药物临床试验设计和实施的重要内容,不同试验目的、不同试验类型选择的疗效指标尤其主要疗效指标往往存在差异。不同类型的疗效指标具有不同的评估要求、评估标准和评估流程,这就要求数据核查过程中应有针对性地考虑适当的关注要点,才能使核查工作更加高质高效开展。
参考文献
[1] 国家药品监督管理局食品药品审核查验中心. 药品注册核查要点与判定原则(药物临床试验)(试行)[S].2021.
[2] 国家食品药品监督管理局. 中药新药临床研究一般原则[S]. 2015.
[3] 刘炳林. 药物临床试验中疗效指标的选择[J]. 中国新药杂志,2017,26(18):2113-2120.
[4] Huang H, Tang Y, Yu Y, et al. The Reliability and Integrity of Overall Survival Data Based on Follow-up Records Only and Potential Solutions to the Challenges[J]. The Lancet Regional Health-Western Pacific,2023,31:100624.
[5] 刘炳林,薛斐然. 临床试验中疗效指标观察与测量相关问题的考虑[J]. 中国新药杂志,2019,28(24):2939-2947.
[6] 刘炳林. 药物临床试验中有效性指标的分类[J]. 中国新药杂志,2016,25(10):1103-1107.
[7] 刘炳林. 药物临床试验中疗效评价指标及常见评价方法[J]. 中国新药杂志,2016,25(18):2074-2077.
[8] 国家药品监督管理局药品审评中心. 抗肿瘤药临床试验影像学评估程序标准技术指导原则[S]. 2021.
[9] 张正付,王佳楠. 基于审评需要的药物临床试验数据核查[J]. 中国临床药理学杂志,2019,35(23):3162-3164.