您当前的位置:检测资讯 > 科研开发

医疗器械临床试验的统计分析方法

嘉峪检测网        2022-08-26 22:11

医疗器械临床试验到达统计分析阶段时,除非在试验中发生了出乎意料的偏倚,否则应该在研究方案中明确试验所采用的统计分析方法。大多数情况下,在试验实施过程中引入的任何大的偏倚,都无法通过统计分析的调整过程对其进行满意的调整。

 

临床试验中数据分析所采用的统计分析方法应是传统的、经典的统计分析方法,统计分析软件应是国内外公认的、经过国内外权威机构认证的、可再现全部编程过程的统计分析软件,如SAS等。

 

statistical analysis

统计分析方法

 

统计分析应建立在正确、完整的数据基础上,采用的统计模型应根据研究目的、试验方案和观察指标选择,一般可概括为一下几个方面。

 

(一)临床试验基本情况描述

 

在临床统计报告的开始,通常用语言或表格对受试者的参与情况作出总结。包括各研究组别入选的受试者数、全分析集(FAS)对应的受试者例数及占总入选人数的百分比、符合方案集(PPS)对应的受试者例数及百分比、安全集(SS)对应的受试者数及百分比;整个试验过程中,因违背研究方案而被剔除、或者没能完成研究中途失访的受试者,也应分别描述其例数及百分比,并且列明剔除或失访的具体原因。

 

(二)基线分析

 

不论临床试验是否采用随机的方法,基线观测值均应基于治疗前所有患者的值。

 

基线数据的评价有助于标识治疗组间必须均衡的因素,如病人目前的病情、伴随用药、治疗、年龄、性别、社会经济状况、既往病史及其他可能影响主要终点的因素。对基线数据的评价允许选择及采用使潜在偏倚最小化的方法。例如,对那些已知会影响主要终点的因素,可在分配治疗时采用分层或均衡分配的方法。如果在临床试验过程中发现影响主要终点的因素在两组间不均衡,则在数据分析过程中就应该使用调整或标化的方法来使各组间的不均衡达到最小。应采用倾向性评分(propensity score)方法进行调整。

 

描述参加试验者的人口统计学资料(如性别、年龄等)及伴随疾病等,同时,做组间均衡性检验,如平行组设计。平行组设计的器械试验中(由随机化分组获得),各组受试者具有相同的基线特征,唯一的不同点是各组所使用的器械,如试验器械组和对照器械组或试验器械组和常规治疗组,根据所收集的数据进行统计分析并获得组间比较结果。

 

(三)期中分析

 

期中分析是指正式完成临床试验前,按事先制订的分析计划,比较处理组间的有效性和安全性所做的分析。由于期中分析的结果会对后续试验的结果产生影响,因此,一个临床试验的期中分析次数应严格控制。同时,任何设计不良的期中分析都可能使研宄结果有误,所得结论缺乏可靠性,因此应避免设计不良的期中分析。如进行了计划外的期中分析,在研究报告中应解释其必要性,提供可能导致的偏倚的严重程度及对结果解释的影响。最后,期中分析应考虑I类误差膨胀的问题。

 

(四)验证假设

 

在开始一个详细的统计分析之前,有必要对预计的统计分析中使用的假设进行验证。这些假设包括用于假设检验或估计的概率分布的主要特征;诊断因素在各中心及各组间分布的相似性;以及验证变量间可疑的关联(相关或不相关)。

 

对统计检验中要用到的分布和方差假设进行验证是非常重要的。只有当所有假设被验证时,此种统计检验才能被应用。例如,假设服从正态分布,那么应对数据用适当的统计方法进行检验,以保证数据没有显著地偏离正态分布。如果数据显著地偏离了正态分布,那么就要使用其他的更合适的检验方法,如非参数检验方法。非参数统计讲的只是检验分布在位置上是否相同。非参数统计方法很多,常用的有卡方(图片2)检验、秩和检验等。其中卡方检验的用途较广,细分为适合性检验和独立性检验。

 

下面通过案例来了解一下适合性检验,适合性检验指的是利用样本信息对总体分布作出推断,检验总体是否服从,某种理论分布(如均匀分布或二项分布)。

 

[4-1案例] 根据以往的调查,某医疗机构研究者对3种不同医疗器械A、B、C产品的满意度分别为0.45、0.31和0.24。现从各家医疗机构中随机选择60名研究者评定该3种不同医疗器械,从中选出各自最满意的产品。结果有30人选产品A,18人选产品B,12人选产品C,试问研究者对3种产品的态度是否有改变?

 

产品

A

B

C

实际次数(A)

30

18

12

理论次数(T)

27

18.6

14.4

 

表1  3种产品研究者选择的频数

 

医疗器械临床试验的统计分析方法

 

(五)参数估计、置信区间估计与假设检验

 

参数估计、置信区间估计和假设检验是对主要指标及次要指标进行评价和估计的必不可少的手段。基本上,所有的比较分析都要进行假设检验。统计分析报告中应明确地陈述要检验的假设、待估计的处理效应、选择的统计检验方法以及所设计的统计模型等。处理效应的估计应同时给出置信区间,并说明计算方法。假设检验应明确说明所采用的是单侧还是双侧,如果采用单侧检验,应说明理由。

 

(六)协变量分析

 

除器械本身的作用以外,常常还有其他一此因素可影响器械的有效性评价,如受试者的基线情况、不同研究中心之间的差异(中心效应)等。这些因素在统计学上可作为协变量处理。在试验前应深思熟虑地识别可能对主要疗效指标有重要影响的协变量及如何进行分析以提高估计的精度,补偿处理组间由于协交量不均衡所产生的影响。

 

在多中心临床试验中,如果中心间处理效应是齐性的,则在模型中常规地包含交互作用项将会降低主效应检验的效能。因此,对主要指标的分析如采用一个考虑到中心间差异的统计模型来研究处理的主效应时,不应包含中心与处理的交互作用项。如中心间处理效应是非齐性的,则处理效应的解释是复东的。

 

(七)疗效评价

 

对主要指标及次要指标进行评价和估计的必不可少的手段是进行参数估计、置信区间和假设检验。

 

非劣效试验应该使用待估计参数的点估计及其95%置信区间来评价。

 

一般来说,对于连续型主要疗效评价指标(如冠脉支架手术中的晚期管腔丢失等),常使用调整中心和基线效应的协方差分析;对于离散型主要疗效评价指标(如成功、失败等),常使用多元Logistic回归分析方法,此时,中心和基线效应作为协交量放在模型中进行调整。

 

在某此医疗器械临床试验中,有时由于伦理原因或可行性原因,很难实行随机双盲临床试验,因此,可能会碰到基线不均衡的研究,此时可使用倾向性得分法(又名Propensity Score,PS方法)进行调整。

 

(八)安全性评价

 

医疗器械临床试验中,安全性评价是非常重要的一个环节。在临床试验的早期(如适用),这一评价主要是探索性的,且只对不良反应明显的表现敏感,在后期,器械的安全性评价一般通过较大的样本来更加全面的了解。后期的对照试验,是一个重要的以无偏的方式探索任何新的、潜在的器械不良反应的方法。

 

为了说明在安全性方面与其他器械比较的优效性或等效性,可设计某些试验,这种评价需要相应的确证性试验的支持,这与相应的有效性评价的要求是相同的。

 

器械安全性评价的常用统计指标为不良事件发生率和不良反应发生率。对于试验时间较长、有较大的退出治疗比例或死亡比例时,需用生存分析计算累计不良事件发生率。用于评价器械安全性的方法以及度量准则依赖于非临床研究和早期临床研究的信息,器械使用方法、受试者类型及试验的持续时间等。而构成安全性评价的资料则主要来源于临床不良事件、实验室检查及生命指征等。

 

从受试者中收集的安全性变量应尽可能全面,包括受试者出现的所有不良事件的类型、发生时间、严重程度、处理措施、持续的时间、转归及是否认为与试验器械有关等。

 

所有的安全性指标在评价中都须十分重视,其主要分析方法需在研究方案中指明。所有的不良事件均须报告,无论是否认为与试验器械有关。在评价中,研究人群的所有可用资料均需说明。实验室应提供检查指标的度量单位及参考值范围等。

 

在大多数的临床试验中,对安全性的评价常采用描述性统计分析方法进行。

 

分享到:

来源:SNT器械服务