摘要:将偏最小二乘法(PLS)与近红外漫反射光谱法相结合,对复方乙酰水杨酸片进行无损非破坏定量分析.建立了最佳的数学校正模型,比较了样品中3种有效成分(乙酰水杨酸、非那西丁和咖啡因)同时测定和单独测定时的主成分数对PLS定量预测能力的影响,预测了未知样品。3种有效成分同时测定和单独测定建立的PLS模型具有相同的主成分数,PLS预报浓度与参考浓度具有相近的标准偏差,说明用PLS法同时测定3种组分的含量是可行的。
关键词:近红外漫反射光谱偏最小二乘法 复方乙酰水杨酸片 非破坏定量分析
近红外分析技术自20世纪90年代以来取得了重要进展。随着近红外分析仪的发展以及计算机科学和化学计量学的进步,可以实现近红外光谱法对样品进行无损非破坏定量分析。近红外漫反射光谱位于1100~2500 nm,其谱带较宽,组分问光谱重叠严重,给非破坏分析带来了困难。近红外漫反射光谱法同化学计量学技术相结合,能有效地解决这个问题。这种方法具有速度快、操作简单、所需样品少等特点,能够实现样品分析的时间同步、地点同步及无损非破坏分析。
笔者研究了偏最小二乘法(PLS)与近红外漫反射光谱相结合定量分析复方乙酰水杨酸片剂药品,讨论了主成分数对预测有效成分含量的影响,分别建立了复方乙酰水杨酸片的有效成分乙酰水杨酸、非那西丁和咖啡因的最佳PLS数学校正模型,并作了比较,分别预测了校正集和预测集中3种有效成分的含量。
1 实验部分
1.1 主要仪器与试剂
紫外可见近红外分光光度计:uV一3100型,附带ISR一3100积分球,日本岛津公司;长城GW386/330微机:通过RS一332通讯端口与uV一3100分光光度计的专用接口板连接;复方乙酰水杨酸片:吉林省长恒药业有限公司;实验所用试剂均为分析纯,符合中国药典规;实验用水为二次蒸馏水。
1.2 样品测定
将47个批次的复方乙酰水杨酸片随机分成两组,一组为校正集(40个),另一组为预测集(7个)。47个样品浓度参考值的测定:取复方乙酰水杨酸片称量、溶解后,按照国家卫生部部颁标准 测定,分别计算出乙酰水杨酸、非那西丁和咖啡因的浓度。
1.3 测定条件
将片剂药品装于积分球样品槽的中心位置,四周用硫酸钡(分析纯)固定。设置光谱带宽为12nm,波长扫描范围为1 100—2500 nm。每个样品连续扫描4次,取吸光度的平均值作为有效数据。
1.4 数据处理
偏最小二乘法利用主成分分析将吸光度矩阵和浓度矩阵分别分解为特征向量和载荷向量,然后用偏最小二乘法建立这些变量之间的相互关系,从而得到吸光度矩阵与浓度矩阵之间的数学校正模型。用交互校验法确定最佳主成分数,详细原理与算法见文献。所用PLS软件为TQ Aanlyst 6.1.1软件包(美国Thermo Nicolet公司),其它辅助软件自行编制。评价定量分析结果的误差采用校正集样本的标准偏差SSEC和预测集样本的标准偏差s。
2 结果与讨论
复方乙酰水杨酸片的组成成分为:乙酰水杨酸、非那西丁、咖啡因和淀粉等辅料。乙酰水杨酸、非那西丁、咖啡因3种有效成分的NIR光谱重叠非常严重,用经典的光谱分析方法难以定量分析,必须与化学计量学方法相结合才能对其进行准确定量。图1(略)为4组不同批号复方乙酰水杨酸片的近红外漫反射光谱。由图1可见,近红外光谱的分辨率较差,各化合物之问光谱重叠严重,因此要充分利用光谱所提供的信息,采用多波长数据,即采用1 100~2500 am之问的光谱数据进行综合分析。
2.1 样品在前两个主成分上的得分
近红外光谱的变化是由许多因素引起的(如样品的成分、成分之间的相互作用、光谱仪的影响、环境对基线的影响、样品的前处理等),每个光谱都是这些因素各自产生的光谱的加和,即可以看作是自己的“纯光谱”乘上一个权重(标量)得到的。在化学计量学中,这些“纯光谱”称为主成分,而权重则称为得分。多元校正方法要求适当设计校正集样品,以获得较好的预测结果。40个校正集和7个预测集样品的光谱数据在第一主成分和第二主成分上的得分分布见图2。由图2可以看出,预测集样品较均匀地分布于校正集样品之中。
2.2 最佳主成分数的选择
利用PLS方法建立校正模型,其中最困难的问题是如何确定建立模型所使用的主成分数。如果建立模型时使用的主成分数过少,就不能反映未知样品中被测组分测量数据(如光谱)的变化,其模型预测准确度就会降低,这种情况称之为不充分拟合。如果使用过多的主成分数建立模型,就会将一些代表噪音的主成分加到模型中,使模型的预测能力下降,这种情况称之为过度拟合。要找到恰当的主成分数来保证既能避免不充分拟合,又能避免过度拟合情况的出现,最常见的方法是采用预测残差平方和 (Prediction Residual Error Sum of Square,缩写为PRESS)作为评价标准,用E RE鸥表示。即使用一定数目的主成分建立一个模型,然后用这个模型对参加建模的每个样品进行预测,求出每个样品的预测值和已知参考值的差。
E眦站值最小,说明建模的预测能力最好。在最佳波长区间情况下分别讨论校正集样本3种有效成分同时测定时不同主成分数对E RE 值的影响和3种有效成分单独测定时不同主成分数对E 跚的影响。图3(略)表明了不同主成分数对E RE 的影响,由图3可以看出,无论3种有效成分同时测定还是单独测定,当乙酰水杨酸、非那西丁和咖啡因的主成分数分别为5、4、4时,模型均有最小的E RE 值;当主成分数较大时,E RE鸥值明显增大,说明3种有效成分的最佳主成分数分别为5、4、4。
2.3 PLS模型的可靠性评价
最佳主成分数确定以后,则可以建立预报用的数学校正模型,这些模型是非线性的,3种有效成分数学校正模型的主成分数分别为5、4、4。分别用最佳校正模型预报校正集样本的浓度,所得到的预测浓度值和参考浓度值的线性回归方程的有关参数列于表1(3种有效成分同时建立模型)和表2(3种有效成分单独建立模型)。从表1和表2中可以看出,虽然3种有效成分单独建立模型的线性回归方程的相关系数比3种有效成分同时建立模型的线性回归方程的相关系数稍大,但是相差不多,而且s 和SSEP十分相近,因此可以采用3种有效成分同时建立模型的方法,这样会大大加快建立模型的速度。另将预测集7个批号的光谱数据输入计算机,
用已经建立的数学校正模型对其浓度进行定量预报,所计算的预测值和参考值的线性回归方程的有关参数列于表3(3种有效成分同时建立模型)和表4(3种有效成分单独建立模型)。
由表1一表4可知,表3和表4对比的结果与表1和表2对比的结果相同,这样进一步证明了采用3种有效成分同时建立模型的方法是可行的,校正集和预测集的标准偏差均很小(<0.79%),结果准确可靠。(表略)
3 结论
PLS法同近红外漫反射光谱法结合、无损非破坏定量分析复方水杨酸片有效成分含量的方法,同卫生部标准测定方法相比,速度快且简便。3种有效成分同时建模和单独建模的标准偏差相近,因此3种有效成分的含量可以同时测定。用PLS法测定复方乙酰水杨酸片的含量,与国家卫生部部颁标准测定的含量相比,无论是校正集还是预测集,其标准偏差都很小,结果准确可靠。