您当前的位置:检测资讯 > 法规标准
嘉峪检测网 2025-02-17 08:36
1、引言
2024年,国家药典委员会先后发布了两次《关于9101 分析方法验证指导原则标准草案的公示》,两次公示稿内容基本一致,但相比于2020年版中国药典,几乎是天壤之别。本文仅围绕其中的“线性验证”的话题展开。
公示稿中,线性验证不再拘泥于经典的“线性响应”,其范围扩大到“非线性响应”、“相对响应”和“多变量校正”。对于“线性响应”验证数据的报告要求也随之发生变化,公示稿要求:应提供数据图、相关系数或其平方值、y 轴截距和回归曲线斜率,应评估回归分析的残差图中任何非随机模式的影响【1】。
对比2020年版中国药典的要求可以发现,“残差平方和”将成为历史,取而代之的是“残差图”,这一点也顺应了ICH Q2的变化,实现了与国际先进技术的协调统一【2,3】。
本文将从原理上解读“残差平方和”被取代的原因、结合典型图形分析“残差图”的含义,并在文末附上详细的“残差图”绘制方法,旨在与大家分享经验所得,欢迎交流讨论。
2、“残差平方和”被取代的原因
统计学上,将数据点与它在回归线上相应位置的差异称为残差,把每个残差平方之后加起来,称为残差平方和,可表示随机误差的效应。
从上述定义可以看出:
● 随着回归拟合的数据点越多,“残差平方和”将会越大,因为仅当数据点完全落在回归线上时残差才为0,残差等于0的概率远低于不等于0。
● 随着回归拟合的数据点的数值越大,“残差平方和”将会越大,因为在相同变异程度的情况下,回归拟合的数据点数值越大则残差越大。
综上:残差平方和并不具有绝对意义的可比性,且无法制定科学、统一的可接受标准,但在一定程度上可以反映线性拟合的优劣。而一直广为流传的“一组数据的残差平方和越小,其拟合程度越好”也并非完全错误,当比较两种分析方法的线性拟合优劣时,需要增加一些先决条件以保证残差平方和的可比性,在分析检测方面通常为:相同的检测原理、相同的检测设备及型号(如不同型号间响应基本一致,也可忽略此要求)、相同的标准品及浓度、相同的线性拟合点数量。
正是因为残差平方和的可比性受限,无法制定科学、统一的质量标准,故而其退出方法学验证的指标,合情合理。
3、如何分析“残差图”
根据药典委2024.11.18日发布的《关于9097分析数据的解释与处理指导原则标准草案的公示》,残差图(也称为残差分布图),是在垂直轴上绘制残差、在水平轴上绘制预测响应构成的图,常应用于模型构建后对模型拟合优度的诊断【4】。典型的残差图如下图所示:
此图来自《关于9097分析数据的解释与处理指导原则标准草案的公示》
上图中,包含残差的四种模式,每种模式表示的误差来源不同。笔者分析如下:
图A是无规律的随机散布点,说明模型中误差主要来源为随机误差,此图属于正常的残差图,表示模型的拟合度较好。
图B是弯曲的残差图,说明模型中误差除了随机误差外,还受其他的固有因素影响,此图属于非正常的残差图,表示模型拟合度较差,模型中需要增加二次项。
图C包含多个远离点集的残差点,这些离群点可能是异常值,此图属于基本正常的残差图,但由于部分拟合点的数据误差较大(可能为操作失误等偏差导致),对模型的拟合度有负面影响,这些异常点需要通过复测纠正或从拟合模型中去除。
图D中的观测值沿水平轴方向展宽增加或减少,违反了恒定方差的假设,此图为非正常的残差图,通常发生的情况为样品浓度超过线性范围。
4、 “残差图”的绘制
可采用分析人员熟悉的excel进行残差图的绘制,笔者以下表中数据为例:
线性溶液 |
浓度(ug/ml) |
峰面积 |
定量限溶液 |
0.253 |
9.464 |
50%线性溶液 |
0.506 |
18.479 |
100%线性溶液 |
1.012 |
37.456 |
150%线性溶液 |
1.518 |
55.672 |
200%线性溶液 |
2.024 |
73.486 |
Step1-打开excel自带的“数据分析”功能:打开一个工作簿,依次点击“文件”→“选项”→“加载项””→“转到””→勾选“分析工具库”。
Step2-开始绘制残差图:点击“数据分析”→“回归”,依次输入数据区域(X值输入区域为浓度数值列、Y值输入区域为峰面积数值列,注意不要包含首行标识)、置信度默认95%、勾选“残差图”和“线性拟合图”(详见下图)。
Step3-查看残差图:结果默认输出到新的工作表组中,查看残差图效果如下:
参考文献:
【1】《关于9101 分析方法验证指导原则标准草案的公示》
【2】中国药典2020年版
【3】ICH Q2(R2)
【4】《关于9097分析数据的解释与处理指导原则标准草案的公示》
来源:注册圈