酸度是水质检测的重要指标,目前检测酸度的方法主要有电位滴定法、pH指示剂法、荧光光谱法等,这些方法虽然能够得到较为精准的酸度,但是pH指示剂法需要消耗化学试剂,而电位滴定法、荧光光谱法是离线方法,需要较长的分析时间,不能够满足现阶段绿色、快速的检测要求。近红外光谱法作为一种新兴的绿色检测技术,因具有分析快速、无损、非接触和可通过光纤传输进行实时监测等优点,已被广泛用于农业、化工、医药等领域的检测分析研究中,鲜有在水质酸度检测中的应用研究报道,其主要原因是水质酸度光谱分析的模型精度达不到应用需求。
水溶液中物质成分含量的近红外光谱分析标定试验中,通常使用比色皿装样,然后检测透射式光谱信号。若同时使用多个比色皿,可简化试验过程,缩短试验时间,提高分析效率。但是,由于不同比色皿之间材质的均匀性和透光率存在微小差异,不同比色皿的光谱差异和随机噪声不可避免,影响了光谱分析多元校正模型的精度。
正交信号校正 (OSC)是由学者WOLD于1988年提出来的一种光谱数据预处理方法。文献利用OSC对橡胶样品的近红外光谱数据进行预处理,所建立的多元校正模型得到了满意的预测精度。文献提出了一种基于直接正交信号校正(DOSC)的模型传递方法,结果表明DOSC可以去除光谱数据中与待测成分无关的噪声,达到减小不同批次样本光谱间的差异的目的。文献对多环芳烃样本的光谱数据进行OSC预处理后建立了偏最小二乘(PLS)模型,结果表明PLS模型的预测性能经 OSC预处理后得到了较大提升。文献利用随机森林结合OSC的方法建立了3台光谱仪的玉米数据的传递模型,结果表明该方法可以有效消除光谱噪声,减小不同光谱仪间的光谱差异。这些研究表明OSC具有去除光谱数据中的噪声、减小光谱间的差异并提高模型预测精度的作用。
因此,本工作在水质酸度的近红外光谱分析试验中,用两个比色皿对32个不同酸度的水溶液样品进行装样,采集光谱数据。为减小不同比色皿装样光谱间的差异,提高水质酸度近红外光谱定量分析模型的预测精度,采用OSC对光谱进行预处理。对OSC预处理前后的光谱差异和水质酸度定量分析模型的预测精度进行了比较,探讨了OSC用于不同比色皿的光谱背景干扰的去除效果。
1、 试验部分
在水中随机加入不同体积的盐酸标准溶液或氢氧化钠标准溶液,获得32个具有不同酸度的水样,依次编号为S1~S32。用酸度计测量水样pH(参考值),32个水样的pH为1.64~9.31,平均值为6.27。标准差为2.03。
对于同一个水样,分别用同一批次生产的两个石英比色皿(分别记为1号和2号)进行装样,以空光路为背景,设置扫描范围为700~1050nm,平均次数为200,积分时间为29ms,平滑次数为3,获得两组该样品的近红外光谱数据;采用OSC对两组光谱数据分别进行预处理,得到预处理后的近红外光谱数据。
OSC的基本原理如下:将光谱数据矩阵(X)与浓度数据矩阵(y)直接正交,然后再对正交后的X进行主成分分析,通过去除X中与y不相关的正交成分,从而消除X中的背景干扰和随机噪声。
2、 结果与讨论
2.1 不同比色皿装样的光谱差异分析
以样品S1为例,得到的近红外光谱图见图1。
由图1可见,两个比色皿装样获得的近红外光谱整体趋势相似,但1号比色皿对应的吸光度较强,特征峰更明显。
2.2 不同比色皿装样的光谱建模差异分析
根据各水样的酸度参考值,按照梯度法对32个样品进行划分,其中校正集包含24个样品,验证集包含8个样品。分别用两个比色皿装样分析,采用交叉验证法确定主成分数,建立水质酸度的PLS模型,采用预测均方根误差(RMSEP)和相关系数作为模型的精度评价指标。
结果显示,1号比色皿装样所获光谱的PLS模型的主成分数为7,RMSEP值1.096,相关系数为0.818;而2号比色皿装样所获光谱的 PLS模型的主成分数为4,RMSEP值 为 2.008,相关系数为0.454,两个模型的RMSEP差值为0.912,相关系数差值为0.364,预测精度有明显差别,说明不同比色皿的光谱背景干扰对水质酸度的多元校正模型的预测性能有影响。
2.3 基于OSC的光谱背景干扰去除效果
对校正集和验证集的两组光谱数据分别进行OSC预处理。以样品S1为例,经OSC预处理前后两个比色皿装样获得的光谱吸光度差值见图2。
由图2可见:OSC预处理前,两个比色皿装样获得的两条光谱吸光度差异值相对较大,平均差异值达到1.0×10-2级;经OSC预处理后,两条光谱吸光度差异值相对较小,平均差异值减小至5.6×10-4级。
采用光谱平均差异(ARMS)来评价光谱差异大小,采用光谱校正率(Prcorrected)来评价光谱校正效果。ARMS和Prcorrected的计算公式见公式(1)和公式(2)。
结果显示,预处理前,样品S1的两组光谱数据的ARMS值为0.0042,预处理后,两组光谱数据的ARMS值为0.0013,Prcorrected值为90%。
2.4 基于OSC的建模结果
使用经OSC预处理后的两组光谱数据建立PLS模型。结果显示:经OSC预处理后,1号比色皿装样所获光谱的PLS模型的主成分数为5,RMSEP值为0.964,相关系数为0.924;2号比色皿装样所获光谱的PLS模型的主成分数为5,RMSEP值为0.759,相关系数为0.931,两个模型的RMSEP差值为0.205,相关系数差值为7.00×10-3。相比2.2节未经OSC预处理的光谱建立的PLS模型,模型预测精度明显提高,RMSEP差值和相关系数差值分别减 小 了78%和98%,表明OSC预处理能减小比色皿背景干扰对水质酸度的多元校正模型的预测性能的影响,可提高多 元校正模型的预测精度.。
3、 结论
本工作分析了使用两个比色皿采集水溶液的近红外光谱差异及其对水质酸度定量分析模型的影响,采用OSC对两组光谱数据进行预处理,可以减小不同比色皿装样的光谱差异和提高多元校正模型的预测精度,为提高近红外光谱的分析效率和定量分析模型的预测精度提供参考。