您当前的位置:检测资讯 > 科研开发

不同统计方法在磁粉检测能力验证结果分析中的应用

嘉峪检测网        2023-02-10 17:54

能力验证是指通过对实验室检测结果进行对比分析,来对实验室的能力进行系统评价的一项活动。依据CNAS-RL02:2018《能力验证规则》的要求,申请国家认可委(CNAS)认可的实验室在申请的每个子领域均应参加能力验证活动并证明其技术能力;获准认可的实验室也要按一定频次定期参加能力验证活动。
 
上海材料研究所机械工业无损检测中心(SRIMNDT)是国家认可委认定的NDT能力验证提供者(注册号:PT 0052),按照ISO/IEC 17043《合格评定 能力验证的通用要求》开展无损检测领域的能力验证活动。无损检测能力验证涉及到磁粉检测、超声检测、射线检测和渗透检测等领域。
 
无损检测能力验证的数据统计和结果分析对于能力验证计划的合理设计、有效分析、客观评价和结果利用都具有重要作用。本文以2018年和2019年两个年度的磁粉检测能力验证结果为例,探讨了不同统计方法对能力验证结果分析的影响。
 
一、磁粉检测能力验证结果评价现状
 
目前,主要采用偏倚估计值法和数理统计两种方法对磁粉检测能力验证结果进行评价。偏倚值估计法是将考核样品定值实验得出的参考值作为指定值X,将能力验证参加者的检测结果x与指定值X的差值与最大允许误差或参考值的不确定度进行比较。数理统计则是通过对参加同一批能力验证的检测结果进行统计分析,来确定指定值X和能力验证评定标准差图片,并进行合格判定。常用的能力验证统计方法主要分为异常数据检验法和稳健统计法。
 
异常数据检验法主要是基于格拉布斯(Grubbs)等准则的经典统计法,其特点是在给定的显著性水平下,通过概率统计的原理发现并剔除异常值。由于其显著性水平是人为给定的,所以准确性也会受到人为因素影响。
 
稳健统计法是指不用识别或剔除离群值,可使用所有测量数据将离群值的作用降低的统计分析方法。目前标准中推荐的稳健统计法主要是中位值和标准化四分位距法和迭代法。相较于异常数据检验法,稳健统计法的优点是异常值的判定不受人为因素影响,当检测数据符合或者较符合正态分布时,都可以得到较为可靠的分析结果,但当数据明显偏离正态分布时,稳健统计法不是最优的选择。有研究者在对医学检验实验室能力验证结果评价中发现,当能力验证检测数据较多时,稳健统计法比异常数据检验法更为严格。
 
磁粉检测是一种常规的无损检测技术,是铁磁性材料表面缺陷检测的首选方法。其以磁粉作为显示介质,对铁磁性材料工件的缺陷进行观察,具有操作简便、成本低廉、检测灵敏度高等优点。但是这种方法对检测人员的经验水平要求较高,若在磁化过程控制、磁悬液使用、磁粉观察等过程中操作不当,检测结果都会产生较大偏差。
 
由于磁粉检测结果受人为因素影响较大,统计的检测数据不易满足正态分布,不同的统计方法对分析结果的影响较大。文中使用了异常数据检验法中的格拉布斯统计法,中位值和标准化四分位距法和迭代法,对磁粉检测能力验证结果进行分析比较,探索适用于不同情况下的数据统计方法。
 
二、数据统计方法介绍
 
1、Z比分数
 
Z比分数是判定能力验证检测结果的主要依据。Z比分数是由参加者的结果x、能力验证的指定值X和能力验证评定标准差图片得到的实验室偏倚的标准化度量。文中的3种统计方法中,指定值X是由参加者结果统计得到的平均值、中位值或稳健平均值;标准差图片代表了稳健标准差、标准化四分位距或传统标准差。Z比分数计算公式为:
 
当|Z|≤2时,表明结果满意;当2<|Z|<3时,表明结果有问题;当|Z|≥3时,表明结果不满意。
 
2、格拉布斯统计法
 
格拉布斯统计法是基于格拉布斯准则的一种经典统计法。格拉布斯准则是以正态分布为前提,在应用前需要验证数据是否基本符合正态分布,并且需要确认统计的检出水平α和剔除水平α*。依据一组数据的α和α*以及数据个数n,通过查阅格拉布斯检验临界值表获得临界值G1-α(n)(单侧情形)或G1-α/2(n)(双侧情形)。
 
在计算得到该组检测数据的初始平均值和标准差后,通过检测数据的最大值或最小值计算统计量Gn值,当统计量Gn值大于检出水平α对应的临界值时,再将该值与剔除水平α*对应的临界值比较,如果超限则作为统计离群值剔除,并重新计算数组平均值和标准差,按照以上步骤进行重复判定,直至没有出现新的统计离群值。在格拉布斯统计法中,最终以去掉统计离群值后的平均值和标准差作为指定值和能力评定标准差。
 
常见的检出水平α和剔除水平α*为0.005~0.1,数值越大代表了检出和剔除要求越严格。文中选定的检出水平α和剔除水平α*分别为0.1和0.05,即超出95%范围的数值被认定为统计离群值,以有效排除磁粉检测中人为因素造成的异常检测结果对统计结果的影响。
 
格拉布斯统计法的优点是对离群值的定位十分有效,其适用于离群值较少的情形,但在检测数据过于分散,产生较多离群值的情况下,该方法则不适用。
 
3、中位值和标准化四分位距法
 
中位值和标准化四分位距法是目前能力验证机构广泛使用的一种稳健统计法,其采用数据中位值作为指定值,并计算标准化四分位距作为能力评定标准差。通过计算上四分位值与下四分位值之间的差值得到四分位距,并乘以因子0.7413得到标准化四分位距。
 
该统计方法的特点是将前25%数据和后25%数据的影响降低,主要使用中间段50%数据,其应用前提同样是正态分布,但现实中大多数数据并不能严格满足要求,如果中间段50%数据过于集中,容易导致得到的能力评定标准差偏小,产生第一类错误(弃真)。如果数据所有异常值出现在同一侧,或者产生“双峰”现象,则统计模型失效,甚至产生第二类错误(取伪)。
 
4、迭代法
 
迭代法也是一种稳健统计法,其原理是将检测数据按照升序排列后,以中位值作为参照值,距离较远的数值分配较小的权重,距离较近的数值分配较大的权重,并计算得到稳健平均值x*和稳健标准差s*。迭代法不但可以最大程度减小离群值的影响,还可以降低可疑值的作用。相较于中位值和标准化四分位距法,迭代法可以应用在一些非正态分布的数据中,并得到相对准确的统计结果。但对于分布严重不对称、双峰分布或大比例数据相同的数据模型,迭代法也可能会失效。
 
5、其他方法
 
除了本文使用的3种方法,还有一些其他统计方法也常用于能力验证的结果分析中。在经典统计法中,还有狄克逊(Dixon)统计法、奈尔(Nair)统计法等,可用来确定并排除离群值。在稳健统计法中,CNAS GL002:2018《能力验证结果的统计处理和能力评价指南》还推荐了算法S,用于计算标准差(或极差),并可推出标准差或极差的稳健联合值。
 
三、数据来源
 
数据取自笔者所在单位在2018年和2019年组织的钢焊缝磁粉检测能力验证活动(参与的实验室分别为21家和24家),所有实验室所检均为同一钢焊缝样品。
 
能力验证样品采用普通碳素钢焊接而成,焊接方法为二氧化碳气体保护焊,焊接形式为对接焊缝,焊缝表面有焊接形成的缺陷。检测方法为传统的磁轭法,并采用相关焊缝磁粉检测标准进行检测。标准试样中有两处缺陷,参加能力验证的实验室需要分别对缺陷的显示位置(X1,X2)和长度(L1,L2)进行检测。
 
四、结果与讨论
 
采用未剔除离群值的经典统计法作为参照,使用格拉布斯统计法、中位值和标准化四分位距法和迭代法对2018年和2019年钢焊缝磁粉检测能力验证检测结果进行统计,结果如表1和表2所示。2018年和2019年的统计数量分别为21个和24个,分别对4个分项检测指标(X1,L1,X2,L2)进行统计。
 
表1 2018年钢焊缝磁粉检测统计结果
 
表2 2019年钢焊缝磁粉检测统计结果
 
1、指定值准确性分析
 
使用的格拉布斯统计法剔除水平α*为0.05。在使用格拉布斯统计法对4组位置数据进行统计时,发现并剔除了离群值后,4组数据的指定值相较于经典统计法的结果发生了偏移,同时能力验证评定标准差减小,对于可疑值的评定更加严格。另外4组没有出现离群值的数据,其得到的指定值和能力验证评定标准差与经典统计法得到的结果相同。
 
应用中位值和标准化四分位距法和迭代法这两种稳健统计法进行统计后,8组数据的指定值相较于经典统计法均发生了偏移,而能力验证评定标准差相应减小。在4组剔除异常结果的数据中,将两种稳健统计法与格拉布斯统计法的结果进行对比发现,迭代法与格拉布斯统计法的指定值更接近,相对于经典统计法结果均发生了同方向的偏移;中位值和标准化四分位距法的指定值未发生偏移,而2019-X1(表示2019年的数据L1,其余类比)指定值的偏移方向与格拉布斯统计法的相反,其余两组的偏移方向与格拉布斯统计法的相同。经过比较,在出现较为明显的异常结果时,迭代法得到的指定值准确性更高。
 
2、严格程度合理性分析
 
为了进一步比较格拉布斯统计法、中位值和标准化四分位距法和迭代法在能力验证结果分析中的适用性,笔者分析3种方法得到的数据满意率,结果如表3(NIOR为四分位距)和表4所示。
 
表3 2018年不同统计方法的满意率分析结果
 
表4 2019年不同统计方法的满意率分析结果
 
在格拉布斯统计法发现离群值的4组数据中,2018-X1,2018-X2和2019-X1基本符合正态分布,使用3种不同统计方法评定的满意率相同,且体现统计方法严格程度的能力验证评定标准差也基本相同;而对于2019-X2,其中位值和标准化四分位距法和迭代法得到的满意率和能力验证评定标准差与格拉布斯统计法的有较大差异。经过对该组数据进行分析,发现数据中有大比例相同的数据,数据整体不符合正态分布,导致了中位值和标准化四分位距法和迭代法分析的结果失真,所剔除的部分离群值为误判,而采用剔除水平α*为0.05的格拉布斯统计法,得到的判定结果更符合实际情况。
 
格拉布斯统计法未发现离群值的4组数据(2018-L1,2018-L2,2019-L1和2019-L2)基本符合正态分布。将中位值和标准化四分位距法和迭代法的统计结果进行比较,发现在2018-L1中,迭代法的严格程度高于中位值和标准化四分位距法的,而另外3组严格程度基本相同。
 
结语
 
(1) 在磁粉检测能力验证结果分析中,当数据模型符合或基本符合正态分布模型时,迭代法、中位值和标准化四分位距法可以排除统计过程中人为因素对结果的影响;迭代法得到的指定值比中位值和标准化四分位距法的更为准确可靠;迭代法的严格程度也略高于后者。当数据模型不符合正态分布模型时,中位值和标准化四分位距法与迭代法容易失效,并可能产生误判,而选用剔除水平α*为0.05的格拉布斯统计法可以得到更合理的统计结果。
 
(2) 应依据数据分布特征合理选择数据统计方法对磁粉检测能力验证结果进行分析,以提高分析结果的可信度。当数据满足或基本满足正态分布时,建议采用迭代法进行结果分析;当数据不满足正态分布时,建议采用格拉布斯统计法,结合检测数据数量、数据分布特征等因素,合理选择剔除水平α*,剔除人为误差造成的异常结果。
 

 
分享到:

来源:无损检测NDT