您当前的位置:检测资讯 > 科研开发

真实世界数据在药物警戒工作中的应用

嘉峪检测网        2023-12-02 18:44

摘  要 / Abstract
 
随着医疗健康数据的快速增长,真实世界数据(real world data,RWD)分析为药物警戒工作带来了新的机遇,成为传统药品不良反应监测模式的有益补充。本文通过介绍几种主要的RWD类型,包括电子健康档案数据、医疗保险数据、注册登记数据、社交媒体数据和多源整合数据的定义和常见数据库举例,并对各种类型数据应用于相关药品安全性监测和评价的案例进行分析,总结了RWD在药物警戒中的应用范畴、优势和局限性,以期为我国利用RWD开展药物警戒活动相关研究的探索和实践提供参考。
 
With the rapid digitalization of healthcare data, the analysis of real world data(RWD) analyses has brought new opportunities for pharmacovigilance and serves as a valuable complement to traditional adverse drug reaction surveillance.This article provides an overview of the definition, database examples and case analysis of major types of RWD in pharmacovigilance, including electronic health record data, health insurance data, registry data, social media data, and multisource integrated data. It summarizes the application scope, strengths and limitations of RWD in pharmacovigilance, aiming to provide references for exploring and implementing RWD-based pharmacovigilance research and practices in China.
 
关 键 词 / Key words
 
真实世界数据;药品安全性;药物警戒;不良事件
 
real world data; drug safety; pharmacovigilance; adverse events
 
药物警戒活动是指对药品不良反应及其他与用药有关的有害反应进行监测、识别、评估和控制的活动[1]。真实世界数据(real world data,RWD)是指来源于日常所收集的各种与患者健康状况和(或)诊疗及保健相关的数据[2]。相较于传统的药物警戒模式,RWD在特殊群体(如儿童、老人、孕产妇等)、罕见事件、远期毒性等方面的药品安全性评价中更具优势,RWD丰富的药品安全性信息资源是传统药品不良反应监测模式的有益补充。本文将对几种主要的RWD类型在药品安全性监测和评价中的应用进行介绍。各类型RWD的定义及常见数据库举例见表1。
1、电子健康档案数据
 
电子健康档案(electronic health record,EHR)是指医务工作人员在日常临床诊疗工作中所记录的电子医疗记录,收集了患者的人口学特征、症状和体征、实验室检查和影像学检查、诊断和治疗及临床结局等临床信息。EHR丰富的临床信息及其覆盖的大样本患者量为药品安全性评价提供了数据基础。得益于电子信息技术的发展,越来越多的国家和地区利用大型EHR数据库开展药品安全性评价。EHR在药品安全性主动监测方面有着广泛应用,如欧洲药品管理局(EMA)的药物流行病学和药物警戒网络中心(European network of centres for pharmacoepidemiology and pharmacovigilance, ENCe PP)、美国食品药品监督管理局(FDA)的哨点监测项目和日本药品医疗器械管理局(PMDA)的医疗信息风险评估行动(medical information for risk assessment initiative, MIHARI),以及我国建立的中国医院药物警戒系统(Chinese hospital pharmacovigilance system, CHPS)等均在药品安全性主动监测项目中持续开发整合利用EHR数据,评价药品的已知严重风险、识别严重风险信号以及非预期的严重风险[3]。除主动监测外,利用EHR开展药品上市后安全性再评价研究的方法也被许多国家和地区的监管部门、学术界和制药企业广泛接受。EHR的具体应用案例如下。
 
1.1 对于使用司美格鲁肽注射液的2型糖尿病患者的安全性主动监测[4]
 
研究背景:司美格鲁肽注射液(Ozempic)于2017年获得美国FDA批准上市,用于2型糖尿病患者血糖控制。FDA在2022年开展了Ozempic安全性主动监测研究,以分析识别新的非妊娠非肿瘤类风险信号。RWD数据源和方法:研究数据来源于2018~2022年FDA哨点监测项目中5个监测点的EHR纵向数据库,从EHR中提取患者年龄、性别、既往病史、糖尿病诊断、Ozempic和西他列汀(Sitagliptin)使用、合并用药、临床结局等信息进行回顾性分析,对启动Ozempic和Sitagliptin治疗的糖尿病患者根据倾向性评分进行1∶1配对,利用Tree Scan软件进行统计分析,比较Ozempic和Sitagliptin两组间不良临床结局发生情况的均衡性,识别风险信号。主要发现和建议:相较于Sitagliptin,Ozempic使用者恶心呕吐及其他代谢症状发生风险增高。EHR数据收集的药物使用和临床结局等信息可以用于药品上市后安全性评价。值得注意的是,此类药品安全性主动监测并没有事先明确检验假设,属于探索分析,不能只依赖统计结果判断风险信号。药品安全性监测和评价需要综合考虑研究设计、药物作用机制、治疗背景和治疗人群等因素进行风险分析。
 
1.2 维得利珠单抗上市后安全性再评价研究[5]
 
研究背景:维得利珠单抗(Vedolizumab)于2014年获得美国FDA批准用于治疗炎症性肠病(inflammatory bowel disease,IBD),但其临床试验缺乏老年患者安全性研究数据。该研究的目的是评价Vedolizumab在老年IBD患者中的有效性和安全性。RWD数据源和方法:采用回顾性观察研究设计,RWD数据来源于2015~2018年英国6家医院老年IBD患者EHR纵向数据库,利用标准化问卷从EHR中收集人口学、疾病诊断和分型、既往病史和治疗史、Vedolizumab治疗、临床应答、不良事件等信息,描述分析临床结局事件。主要发现和建议:74名使用Vedolizumab的老年患者中有6名(占比8%)发生不良事件,不良事件发生率与文献报道的其他年龄组IBD患者相似,因此该研究认为Vedolizumab对老年IBD患者是安全的。同临床试验相比,真实世界中接受治疗的患者群体更加广泛,可能涵盖老年人群、重病人群和妊娠妇女等。该研究利用EHR数据中丰富的临床信息对临床试验中未覆盖的老年患者人群使用Vedolizumab的安全性进行了分析,有效补充了药品在特殊人群中安全性评价证据。
 
随着医院信息系统的建设和完善,EHR数据库所收集的健康和疾病诊疗相关内容不断扩充、质量不断提升,其丰富的临床信息和多样化的患者人群数据为开展药品安全性实时主动监测和药品上市后安全性评价提供了有力的数据支撑。EHR数据用于药物警戒工作具有以下优势:覆盖患者群体广泛,除收集一般患者信息外,还包括儿童、老年人、孕产妇、共病患者等特殊群体的信息;覆盖丰富的医疗保健信息,在日常的临床诊疗实践中收集了详细的患者疾病特征、治疗和检查等临床信息;覆盖长期的随访数据,可用于评估远期临床结局。但EHR数据也具有局限性:由于是以医院为基础的数据,数据源分散、缺乏整合,易发生失访的情况;各医疗机构间医疗实践和数据异质性较大;相较于住院病历,门诊病历多存在诊疗信息记录不完整的情况;存在适应症偏倚和渠道偏倚等。
 
2、医疗保险数据
 
医疗保险数据是为了满足医疗保险支付方对医疗机构的支付和报销的管理需求所收集的医疗保险记录,主要涵盖了患者的疾病诊断和治疗、处方药等编码和简单描述及相关医疗费用信息。常见的医疗保险数据库有美国老年和残障健康保险(Medicare)和医疗补助(Medicaid)数据库、日本的全国医疗保险数据库(National Database of Health Insurance Claims and Specific Health Checkups,NDB),以及我国的城镇职工基本医疗保险和城乡居民基本医疗保险数据库等。医疗保险数据是以人群为基础收集的参保人员在不同诊疗机构和不同时间的就诊和治疗信息,是药品安全性评价常用数据源之一。
 
笔者以戈利木单抗上市后安全性监测[6]为例介绍医疗保险数据的具体应用。
 
研究背景:戈利木单抗是一种单克隆抗体,于2009年获得美国FDA批准用于治疗类风湿性关节炎(rheumatoid arthritis,RA)、银屑病关节炎和强直性脊柱炎。该研究的目的是比较戈利木单抗和其他非生物系统疗法(nonbiologic systemic,NBS)治疗风湿病的安全性。RWD数据源和方法:采用观察性研究设计,RWD数据来源于美国Optum医疗保险数据库,利用其医疗和药品保险索赔信息提取患者性别、年龄、既往病史、风湿病诊断、治疗、临床转归和不良事件等数据。从Optum数据库中识别2009~2014年接受戈利木单抗治疗的风湿病患者作为研究对象,并根据倾向性评分按照1∶4比例与接受NBS治疗的患者进行配对,通过系列治疗组间比较、配对组间比较、巢式病例对照分析以及敏感性分析,比较两组患者抑郁症及其他不良临床结局的发病风险。主要发现和建议:研究共纳入1337例戈利木单抗治疗患者和4227例NBS治疗的倾向性评分配对患者,并未发现戈利木单抗治疗会增加抑郁症及其他不良事件的发生风险。该研究属于药品上市后针对事先定义的不良临床结局开展的主动监测,利用医疗保险数据识别大样本的用药患者及对照组患者,并通过严谨的药物流行病学研究设计和多种统计分析方法控制混杂和偏倚的影响,从而提高研究结果的可靠性。
 
医疗保险数据库收集了以一般人群为基础的医疗保险索赔相关信息,在药品上市后安全性评价研究中有着广泛应用。同其他类型的RWD相比,医疗保险数据库在药物警戒工作中具有以下优势:医疗保险数据覆盖的人群样本量通常较大,研究人群的代表性和结果的外推性较好;用药信息较完整,可以纵向长时间收集用药、随访和结局变量数据,包括开始使用研究药品的情况、药品治疗中断的情况、同期其他药品的使用情况以及其他疾病诊断和不良事件信息等,从而评价药品的近期和远期安全性;数据的结构化较好。医疗保险数据也有局限性,如仅收集医疗保险覆盖人群信息,不能完全代表全人群特征;仅收集有限的诊疗信息,而未收集患者症状、体征以及非保险报销范围内的诊疗操作等信息,不能对疾病严重程度进行准确分层;可能存在漏诊和错分病例,难以对诊断信息进行验证;混杂因素和协变量信息较少,很多重要的混杂因素都未被测量收集等。
 
3、注册登记数据
 
注册登记是指一个有组织的系统,利用标准的方法收集具有某种特定疾病、状况或者暴露人群的临床和其他数据。注册登记研究是药品注册决策中重要的RWD来源,其利用观察性方法系统收集特定人群患者的个体健康相关信息,大致分为疾病注册登记、患者(医疗服务)注册登记以及产品注册登记三大类。其中,患者注册登记研究是指纳入登记的患者均暴露于某些特定医疗保健服务的一类注册登记研究,如北美Corrona(已于2021年更名为Cor Evitas)类风湿关节炎患者注册登记研究和我国的急性心肌梗死注册研究等。产品注册登记研究是指纳入登记的患者均暴露于某种特定医疗产品(单药或某一类药品)的一类注册登记研究。在药品安全性监测和评价中,患者注册登记和产品注册登记是常用的注册登记数据来源。
 
笔者以阿达木单抗安全性评价[7]为例介绍注册登记数据的具体应用。
 
研究背景:阿达木单抗于2002年首次获得美国FDA批准用于治疗RA等疾病。该研究的目的是评价阿达木单抗在美国人群中治疗RA的长期安全性。RWD数据源和方法:采用观察性研究设计,RWD数据来源于Corrona的RA患者注册登记数据库。Corrona建立于2001年,定期从RA患者和风湿科医生处收集疾病诊疗、临床转归、不良事件及患者报告结局等信息和长期随访数据。该研究从Corrona数据库识别2008~2017年使用阿达木单抗的RA患者,收集其人口学、RA诊断和治疗、既往病史和治疗史以及严重感染、肿瘤、心衰等不良事件信息,描述分析阿达木单抗治疗的远期安全性。主要发现和建议:该研究对2798例接受阿达木单抗治疗的RA患者进行分析,发现治疗后严重感染的发病率为1.86/100人年,其中治疗后第一年的发病率远高于一年后的发病率。与之前的研究相比,该研究并未发现新的安全性信号。Corrona患者注册登记系统覆盖美国全国范围的RA患者,利用该数据库所识别的RA患者代表性较好,其长期随访数据可有效用于药品的远期安全性评价,并且研究结果具有很好的外推性。
 
注册登记研究的开展能够有组织地、系统地在较大范围内收集符合条件的患者的疾病诊疗、随访、临床转归信息,甚至包括某些特定疾病和健康量表测量的患者报告结局等内容,信息完整性以及数据结构化和标准化程度均较好,是药品安全监测和上市后安全性评价的重要数据来源。注册登记数据在药物警戒工作中的优势在于:患者样本量大且涵盖患者人群广泛,包括老人、儿童和孕产妇等特殊人群,具有较好的患者代表性、较大的样本量和较高的统计检验效能。注册登记研究利用标准化方式收集数据,定期随访和评估疾病的进展和严重情况,数据质量相对较高,不良事件信息更加详细、系统和完善。此外,随着时间的推移,医疗实践不断改善,通过注册登记研究可以观察患者临床结局在不同诊疗时期的变化趋势。而注册登记研究也存在局限性,包括仅有针对部分特定疾病的注册登记数据,建立注册登记研究成本较高;存在渠道偏倚等选择偏倚,存在信息偏倚和未测量的混杂因素,不能直接进行因果推断;随访时容易发生失访和信息缺失的情况,可能会对罕见不良事件的评价产生严重不良影响。
 
4、社交媒体数据
 
社交媒体是一种在线互动平台和工具,包括网络论坛、微信、微博、快手、抖音、Twitter、Facebook等,被人们广泛使用。据统计,截至2020年,全球活跃的社交媒体用户数达到39亿,约占全球总人口数量的50%以上,其中我国社交媒体用户数超过10亿[8]。人们可以在社交媒体上讨论与健康相关的各种问题,分享就医和诊疗体验以及不良事件的发生情况,社交媒体成为药品安全性信息来源之一。近年来,欧美很多国家和地区正在探索利用社交媒体收集药品不良反应信息的技术和方法。
 
笔者以推特(Twitter)药品不良事件监测[9]为例介绍社交媒体数据的具体应用。
 
研究背景:随着社交媒体中药品相关数据的日益增多,欧盟资助了旨在推进利用社交媒体报告药品不良反应的相关政策、框架、工具和方法推荐项目。鉴于Twitter推文中含有大量药品安全性信息,该研究探索了如何利用Twitter中相关信息识别药品不良事件的方法。RWD数据源和方法:采用回顾性分析方法,RWD数据来源于2012~2015年近6万条抽样Twitter英文推文信息,这些推文内容中至少提及了6种药品(甲磺酸伊马替尼、左乙拉西坦、哌甲酯、索拉非尼、特比萘芬、唑吡坦)中的一种。通过对Twitter中相关信息进行数据治理,制定算法识别药品适应症、不良事件等变量数据并进行描述分析。主要发现和建议:该研究利用Twitter推文识别了6种药品的1056条不良事件阳性报告信息和56 417条不良事件阴性报告信息,研究表明社交媒体数据可以用于识别药品不良事件。社交媒体数据主要是非结构化文本数据,且包含大量的方言,数据治理费时费力。该研究通过制定操作指南和进行培训等方式进行质量控制,为探索社交媒体数据应用于药品安全性评价提供了参考。
 
社交媒体中药品和健康相关数据可应用于药品安全风险信号监测,但其信息体量大且内容繁杂,也给药品不良事件相关数据治理工作带来了挑战,目前其在药品安全性监测工作中的应用尚处于探索阶段。社交媒体数据应用于药物警戒具有以下优势:用户群体多且地理位置分布广泛,利用患者交流平台等媒体平台会更加容易地收集罕见病群体不良事件相关信息;能够直接提供患者视角的药品使用体验,而不是由接诊医生或者药剂师“过滤”和“再加工”处理后上报的不良事件信息;属于即时数据,可以更加快速地监测不良事件的发生及频率。但社交媒体数据也存在局限性:信息内容冗杂,充满各种“噪音”;多为文本、图像和视频等非结构化数据,数据挖掘和处理存在困难;常缺乏对医疗事件的细节描述,用语不规范,难以与医学专业术语匹配以及判断药品与不良事件之间的关系;不良事件可能会被重复发布或者被其他人转发导致重复记录等;存在渠道偏倚和报告偏倚等偏倚和混杂。
 
5、多源整合数据
 
多源整合数据是指将EHR、医疗保险、注册登记等数据甚至不同国家和地区的相关数据进行链接和整合生成的多源数据。随着各种类型健康数据的积累发展,多源整合数据库对不同来源的数据进行链接整合,数据更加全面丰富,为准确监测和评价药品风险信号提供了有力的数据支撑。例如,英国临床实践研究数据库(clinical practice research datalink, CPRD)除通过常规方式从全科医生处收集初级卫生保健数据外,还通过患者个人的英国国家医疗服务体系(national health service, NHS)识别号将患者的初级卫生保健数据、上级医疗服务数据、疾病注册登记数据、死亡登记数据等进行链接整合。CPRD在药物警戒领域有过多项应用[10]。在我国,很多地方探索建立了区域健康信息平台,如宁波市全民健康信息平台。这类多源整合数据库的主要数据来源是当地各级医院、卫生行政部门、疾病预防控制中心和公共卫生机构以及其他医疗卫生机构在日常医疗服务工作中采集获得的患者和居民的医疗健康信息。
 
笔者以利用CPRD开展疫苗安全性监测[11]为例介绍多源整合数据的具体应用。
 
研究背景:该研究的目的是评价利用英国CPRD开展疫苗上市后安全性实时监测、快速识别安全性信号的可行性。RWD数据源和方法:通过观察性研究,RWD数据来源于CPRD。提取2013~2015年流感疫苗和麻疹腮腺炎风疹联合减毒活疫苗(MMR疫苗)接种、人口学、格林-巴利综合征和热性惊厥诊断相关数据,以流感疫苗接种/格林-巴利综合征作为罕见不良结局进行识别测试,并以MMR疫苗接种/热性惊厥作为阳性对照,比较分析两对疫苗/不良临床结局的观察/预期事件结果。主要发现和建议:该研究发现,CPRD可以用于有效识别流感疫苗接种后发生的中等或显著增加的格林-巴利综合征发病风险,以及MMR疫苗接种后轻度增加的热性惊厥发病风险。CPRD是多源整合数据库,收集了疫苗接种、初级卫生保健服务、转诊服务、疾病诊疗等信息,可以用于开展疫苗安全性实时监测,识别疫苗接种后显著增加的罕见不良事件发病风险信号以及轻度增加的常见不良事件发病风险信号。
 
多源整合数据库从不同数据源收集数据并进行整合,收集的信息内容远多于单一数据源,在药物警戒工作中兼具其他数据类型的优势,可用于药品安全性实时主动监测以及药品上市后安全性评价,包括罕见、常见不良事件和远期不良结局风险监测和识别等。多源整合数据通常为大样本人群数据,人群的代表性较好;从多个维度对研究人群特征、暴露、其他危险因素和协变量、混杂因素、临床结局等变量特征进行描述,进行变量交叉验证,深入分析并综合评价药品的安全性,有助于回答更多的研究问题。然而,多源整合数据也具有局限性:由于数据来源较多,难以对每个数据源的数据收集和整理过程进行深入了解,不同数据源的异质性给数据链接、治理和分析过程带来挑战,关键变量定义和算法制定常常需要根据可行性进行调整而不够直观等,这些问题都需要在研究过程中加以注意。
 
上述各类型的RWD应用于药品安全性评价的优势和局限性汇总分析见表2。
 
6、机遇与挑战
 
RWD种类繁多,其收集的药品安全性信息可以广泛用于开展药物警戒活动。除上述EHR、医疗保险、注册登记、社交媒体、多源整合等数据外,还包括近年来蓬勃发展的患者报告结局和可穿戴设备等产生的健康数据。各个国家和地区的药品安全性评价案例也表明,RWD丰富的数据资源可作为传统药品不良反应监测方法的有益补充,用于加强对药品安全风险信号的识别和验证。
 
然而同时需要注意的是,RWD用于开展药物警戒活动也面临着诸多挑战。例如,由于RWD是在日常医疗服务中产生的,而不是根据研究需要而收集的,研究者需要评价和判断哪些数据能回答所要研究的问题,需要理解各类数据的背景、质量和潜在的混杂与偏倚,充分发挥各类数据源的优势,对研究进行合理设计、数据治理、统计分析和结果解读,产生可靠的证据,从而回答药品的安全性问题。同时,RWD面临数据多源异构问题,不同数据源的数据质量参差不齐,缺乏数据的标准化,为数据的治理和统计分析带来巨大的挑战。对此,研究者可通过质量控制,并借助于人工智能和机器学习等信息技术提高数据的利用效率。此外,数据安全、隐私保护和相关伦理问题也是RWD采集、存储、共享和分析过程中备受关注的问题。研究者应建立隐私保护机制,遵守相关法律法规,通过数据去个人隐私化、加强网络安全管理、建立伦理委员会审核制度等,有效保护个人隐私和数据安全。
 
相较于部分发达国家和地区,我国RWD用于药物警戒的研究起步相对较晚,RWD数据碎片化和信息孤岛现象在一定程度上限制了其在药品安全性评价方面的探索和应用。建议加强我国RWD的数据整合力度,增强其可及性,鼓励应用RWD开展药物警戒探索和研究,进一步推进药品安全性全面监测和评价工作。
 
引用本文
 
王蔷,吉永卓成,窦丽霞*.真实世界数据在药物警戒工作中的应用[J].中国食品药品监管,2023(10):60-67.
 
分享到:

来源:中国食品药品监管杂志