首页

近红外模型验证 DOSC—SBC在近红外定量模型批次间传递中的使用

点击:0时间:2023-06-17 07:50:14

贾一飞+张盈盈+徐冰+王安冬+詹雪艳

[摘要] 模型傳递可使特定条件下树立的近红外模型能够运用于新的样品状况、环境条件或仪器状况。正交信号回归是一类依据“光谱布景校对”的模型传递办法,运用虚拟规范光谱拟合主从批次光谱间的线性联系,将从批次光谱向主批次光谱映射,以完结近红外定量模型的传递,但该办法对虚拟光谱的代表性要求较高,回归进程中易呈现较大差错。因而,该文提出一种直接正交信号校对法(direct orthogonal signal correction,DOSC)联合斜率截距校对算法(slope and bias correction,SBC)(DOSC-SBC)的数据处理办法,针对近红外定量模型对不同批次样本制剂进程中方针成分含量猜测准确度较差的问题,剖析不同批次样本间因组分差异带来的光谱布景差异和模型猜测差错的性质,经过DOSC消除与方针值无关的光谱布景差异,联合SBC算法对不同批次间样本批次间系统差错进行校对,完结近红外定量模型在不同批次间传递。该研讨将DOSC-SBC运用于金银花水提和醇沉制剂进程中,模型对新批次样本的猜测差错由32.3%,237%下降到7.30%,4.34%,猜测准确度显着进步,完结了制剂进程中新批次样本方针成分的快速定量。DOSC-SBC模型传递办法完结了近红外定量模型在不同批次间传递,且该办法不需要规范样品,有利于促进近红外技能在中药制剂进程的运用,为中药出产进程中有用成分的实时监测供给参阅。

[关键词] DOSC-SBC; 近红外定量剖析; 模型传递; 中药质量操控

[Abstract] Near infrared model established under a certain condition can be applied to the new samples status, environmental conditions or instrument status through the model transfer. Spectral background correction and model update are two types of data process methods of NIR quantitative model transfer, and orthogonal signal regression (OSR) is a method based on spectra background correction, in which virtual standard spectra is used to fit a linear relation between master batches spectra and slave batches spectra, and map the slave batches spectra to the master batch spectra to realize the transfer of near infrared quantitative model. However, the above data processing method requires the represent activeness of the virtual standard spectra, otherwise the big error will occur in the process of regression. Therefore, direct orthogonal signal correction-slope and bias correction (DOSC-SBC) method was proposed in this paper to solve the problem of PLS model′s failure to predict accurately the content of target components in the formula of different batches, analyze the difference between the spectra background of the samples from different sources and the prediction error of PLS models. DOSC method was used to eliminate the difference of spectral background unrelated to target value, and after being combined with SBC method, the system errors between the different batches of samples were corrected to make the NIR quantitative model transferred between different batches. After DOSC-SBC method was used in the preparation process of water extraction and ethanol precipitation of Lonicerae Japonicae Flos in this paper, the prediction error of new batches of samples was decreased to 7.30% from 32.3% and to 4.34% from 237%, with significantly improved prediction accuracy, so that the target component in the new batch samples can be quickly quantified. DOSC-SBC model transfer method has realized the transfer of NIR quantitative model between different batches, and this method does not need the standard samples. It is helpful to promote the application of NIR technology in the preparation process of Chinese medicines, and provides references for real-time monitoring of effective components in the preparation process of Chinese medicines.

[Key words] direct orthogonal signal correction-slope and bias correction (DOSC-SBC); NIR quantitative model; model transfer; quality control of traditional Chinese medicine

红外光谱技能因其快速、环保、无损等优势已被广泛运用于医药、食物、农业等范畴。近红外定量模型是将光谱数据与被丈量进行相关并树立两者之间的联系。但在特定条件下树立的定量模型,关于来自不同仪器、不同来历或许不同环境下的样本,其猜测准确度或许会下降,呈现模型“失效”的问题,而对不同仪器、环境、来历的样本别离建模,则会耗费很多的人力物力。因而,需要对在特定条件下树立的模型进行模型传递以进步模型的稳健性和包容性。

模型传递是经过必定数量的传递样本,在不同的样本状况、环境条件或仪器状况下,用数学办法在检测信号之间寻求一种改换联系,来增强光谱数据间的通用性和可比性。模型传递可使特定条件下树立的模型能够运用于新的样品状况、环境条件或仪器状况。现在,国内外主要从依据“猜测值校对”和 “光谱布景校对”2种思维展开近红外定量模型传递办法的研讨。依据“猜测值校对”一般选用斜率截距校对算法(slope and bias correction,SBC)[1]来树立主从仪器光谱猜测值间的线性联系,运用该线性联系完结新样本猜测值的校对。依据“光谱布景校对”的模型传递办法有直接校对法(direct standardization,DS) [2]、分段直接校对法(piecewise direct standardization,PDS)[3]、正交信号校对法(orthogonal signal correction,OSC)[4]、直接正交信号校对法(direct orthogonal signal correction,DOSC)[5]以及正交信号回归(orthogonal signal regression,OSR)[7]等。其间,DS和PDS法针对同一样本不同丈量条件下的光谱变异进行校对,常用于不同仪器间的模型传递,但没有考虑待丈量的特征,难以在校对无关搅扰信息的一起不丢失与待丈量有关的光谱信息,而正交信号校对法(OSC)、直接正交信号校对法(DOSC)将光谱正交分化后,仅去除与待丈量无关(即正交)的光谱信息,能很好地校对光谱中其他组分、温度、时刻、仪器等要素变化带来的光谱布景的影响[6],OSR是运用DOSC光谱预处理后,运用主从批次的虚拟规范光谱拟合主从批次的光谱间的线性联系,完结从批次光谱向主批次光谱的映射,完结近红外定量模型批次间的传递[7],可是该办法对主批次和从批次虚拟光谱的代表性要求较高,回归进程中简单呈现大的差错。假如主从批次光谱间存在线性联系,主从批次的猜测值间也线性相关,能够运用SBC算法对从批次猜测值校对,完结近红外定量模型在主从批次间的传递。

不同批次样本制剂进程因为质料、工艺的动摇,不同批次的原药材制剂进程中样本内组分群的差异,形成近红外光谱布景差异和定量模型的较大猜测差错,导致PLS线性模型猜测 “失效”。本文对不同批次样本间因组分差异带来的光谱布景差异和PLS线性模型猜测差错的性质进行剖析,提出DOSC联合SBC的模型传递办法,经过DOSC减小不同批次样本的光谱布景差异,联合SBC算法对不同批次间样本猜测的系统差错进行校对,完结近红外定量模型在不同批次样本间的传递。

1 资料

1.1 仪器

Waters 1525高效液相色谱仪(美国Waters公司),Breeze2 HPLC色谱工作站,Waters 2998二级管阵列检测器,Waters 2707自动进样器,Waters 038040柱溫箱。XDS PROCESS ANALYZER 近红外光谱仪(Foss公司),夹套式100 L多功能提取罐(天津市隆业中药设备有限公司)。

1.2 试剂

绿原酸对照品(上海源叶生物科技有限公司);磷酸(剖析纯,北京化工厂);乙腈[色谱纯,赛默飞世尔科技(我国)有限公司];乙醇(北京化工厂);水为去离子水。

1.3 药材

金银花药材(批次Ⅰ、批次Ⅱ购于安国长安中药材有限公司;批次Ⅲ、批次Ⅳ购于安国云天中药行;批次Ⅴ购于安国永益中药材有限公司)。

2 办法

2.1 数据来历

2.1.1 金银花水提液的数据 金银花提取液中绿原酸含量依照《我国药典》(2015 年版)金银花药材项下规则的办法进行测定[8]。金银花药材投料量为 6 kg,一煎加水12倍,加热回流提取1 h,并于提取前浸泡30 min。二煎加水10 倍,加热回流提取1 h。浸泡及一煎进程 3 min采样10 mL;二煎进程每4 min采样10 mL。运用Foss公司的XDS PROCESS ANALYZER在线收会集试金银花水提液样品NIR透射光谱,光程2 mm,光谱规模12 500~5 263 cm-1,扫描次数32次,分辨率7.8 cm-1,试验选用空气作为参比,每个样品平行收集 3 次。

本试验选用购自安国长安中药材有限公司的金银花制备中试水提样本批次Ⅰ和Ⅱ,选用购自安国云天中药行的金银花制备中试水提样本批次Ⅲ,用3个批次的66个样本作为建模样本,以K-S法挑选42个代表性的样本建模,剩下的24个作为内部猜测集。以购自安国永益中药材有限公司的金银花水提样本批次Ⅳ的19个样本作为外部猜测集,各数据集对应的绿原酸浓度散布见表1。

2.1.2 金银花醇沉液的数据 取必定量的金银花药材,加水煎煮2次,一煎加水15 倍,二煎10倍,每次 0.5 h。兼并提取液,滤过,浓缩密度至1.10。3 000 mL烧杯中取400 mL浓缩液,在500 r·min-1的转速下,以75 mL·min-1速度参加95%乙醇,不同批次参加不同量的乙醇。乙醇参加结束后持续拌和30 min。每隔30 s取样1.5 mL,9 000 r·min-1离心10 min,取上清液别离丈量NIR光谱和参阅值。运用Thermo Nicolet Antaris FT-NIR Analyzer 室温下收集透射光谱,光程8 mm,分辨率为4 cm-1,扫描规模1万~4 000 cm -1,扫描次数16 次,增益为4,每个样品平行收集3 次。

本研讨选用5批醇沉液(批次Ⅰ~Ⅴ)进行进程定量剖析。前3批(批次Ⅰ~Ⅲ)用K-S的办法筛选出120个样本作为初始校对集,剩下60个样本作为内部测验集,批次Ⅳ和Ⅴ的110个样本作为外部测验集,各数据集对应的绿原酸浓度散布见表2。

2.2 数据处理

数据处理均在Unscrambler数据剖析软件(version 9.7挪威CAMO软件公司)和MATLAB软件(version7.0,美国Math Works公司)上完结。

2.3 直接信号校对(DOSC)算法

DOSC算法是在OSC算法的基础上提出的一种改善算法[5],其作为一种光谱预处理办法,是将光谱矩阵(X)与浓度矩阵(Y)正交,将正交后与Y无关的信号滤过,保存与方针值Y相关的光谱信息,并依据以上光谱信息树立定量剖析模型。该办法的完结进程简介如下。

求建模集浓度(Ym)在光谱矩阵(Xm)所打开的空间中的投影Ypj,Ypj=XmXm+Ym(Xm+代表X的广义逆);核算Xm在Ypj正交补空间的投影Xpj,Xpj=(1-YpjYpj+)Xm;对XpjXpj′进行主成分提取,取前几个主成分得到得分矩阵T,[T,D]=SVD(XpjXpj′);核算权重矩阵W,W=Xm+T;从头核算得分矩阵,Tnew=XmW;核算载荷矩阵P,P=XmTnew/(T′newTnew);去除正交信号后,可得新的光谱矩阵,Xnew=Xm-TnewP′=Xm-XmWP′=Xm(E-WP′);由DOSC办法可知,关于待搬运的光谱数据Xtest,依据载荷矩阵P及权重矩阵W即可求出校对后的光谱,XDOSCtest=Xtest-XtestWP′=Xtest(E-WP′)。

从上能够看出该算法是将原光谱Xm经过矩阵(E-WP′)投影到一个由建模集光谱X和浓度Y树立的空间中,光谱X在此空间中只保存了与Y相关的部分,与Y无关的部分被过滤,因而消除了光谱中与方针值Y无关的布景信息形成的偶然差错。一般运用DOSC算法光谱预处理后所建PLS模型能够获得比未经过光谱预处理更好的成果。

可是经过映射后,光谱自身或许存在的系统差错也一起被映射到同一个空间中,故DOSC或许会将本来系统差错扩大,因而需要能消除系统差错的算法来补偿本办法的缺乏。

2.4 SBC算法

SBC算法是一種常用的模型传递办法,经过对模型斜率和截距的调整,使待搬运样本与建模样本的猜测成果附近。

假定原线性校对模型的参数为[β,b],其间β为系数矩阵,b为差错,主批次光谱X1,从批次光谱X2,这2条光谱对应同一个参阅值Y,X2对应的原模型猜测值为Y2,X1与X2存在必定的线性联系[20],可写作X1=kX2+L(其间k为斜率,L为截距);因为所见模型是适合于主批次的,故Y=βX1+b;兼并二式可得Y=β(kX2+L)+b;又因Y2为X2的猜测值,故Y2=βX2+b;由此能够得到Y与Y2的联系:Y=kY2+(L×Σβ+b-kb)。

因k,L以及模型[β,b]为常数,可知Y与Y2之间存在线性联系,可运用少数从批次光谱的原模型猜测值和参阅值拟合得到式中k和L×Σβ+b-kb。

2.5 DOSC-SBC算法简介

DOSC-SBC模型传递办法先运用DOSC算法来消除不同批次样本间由不确定的光谱布景差异形成的偶然差错,然后运用SBC算法消除不同批次光谱间存在的系统差错,详细完结进程见图1。

首要选用DOSC处理后的模型光谱X1树立PLS模型,然后用所得模型对从批次代表性样本X2,即搬运样本进行猜测,将其猜测值Y2t与参阅值Y2进行线性回归,树立近红外定量模型对新批次样本猜测值与参阅值间的线性联系Y2 = slope×Y2t+ bias,依据该线性联系将原模型对从批次样本集X3猜测值进行回归校对,完结模型传递,得到从批次待搬运光谱经过DOSC-SBC模型传递后的猜测值Y3′。

DOSC联合 SBC模型传递办法适用于不同批次样本制剂进程的光谱布景一起存在不确定偶然差错和较大系统差错的状况,假如不存在系统差错,运用本办法或许会呈现过拟合的现象。

3 成果与评论

3.1 差错剖析

3.1.1 金银花水提进程光谱差错剖析 对金银花水提进程中水提液光谱与绿原酸浓度进行相关性剖析,8 500~7 300 cm-1波段与绿原酸含量的猜测密切相关,该波段所建的绿原酸定量模型猜测功能最佳,因而选取光谱中该波段的光谱数据进行剖析,剖析同批次和不同批次样本光谱的差错来历,见图2。

图2中的a图中同一批次金银花水提液样本2条光谱根本重合,c图别离以2光谱的吸光度A作横轴和纵轴,2条光谱A根本落在y=x(对应的空心圆散点连线)这一直线上,违背较小,且A违背不具有单向性,这些小的违背能够看作平行丈量间的偶然差错。b图中不同批次金银花水提液样本光谱能够看出在7 800~7 300 cm-1发生了较大违背,d图中这2条光谱的A作横轴和纵轴,线性联系较为显着,但2条光谱A违背y=x(对应的空心圆散点连线)这一直线较大,能够看出不同批次的样本光谱A的违背除了丈量的偶然差错外,还存在较大的不同批次金银花的组分差异形成的光谱布景差异。

3.1.2 金银花醇沉进程光谱差错剖析 金银花醇沉液光谱中8 500~7 300 cm-1波段所建的绿原酸定量模型猜测功能最佳,因而选取光谱中该波段的光谱数据进行剖析,剖析同批次和不同批次样本光谱的差错来历,见图3。图3 a图中相同绿原酸浓度同一批次的金银花醇沉样本2条光谱根本重合,c图以绿原酸浓度为4.462 g·L-1的同批次2条光谱吸光度别离作为横纵坐标作散点图,其值根本落于y=x(对应的空心圆散点连线)直线上,有较小违背且上下动摇不具有单向性,这些能够看作平行丈量之间的偶然差错;b图中,不同批次之间2条相同浓度的光谱在7 400~7 300 cm-1波段根本重合,然而在8 500~7 400 cm-1波段违背较为显着;d图中绿原酸浓度为2.235 g·L-1不同批次2条光谱吸光度联系图中,线性联系较为显着,但所作散点均坐落y=x(对应的空心圆散点连线)以下,违背较大,且偏向性显着,阐明不同批次的光谱之间除了偶然差错之外,还存在因为不同批次而形成的较大系统差错。

3.2 成果剖析

为了比照DOSC与DOSC-SBC进行光谱数据处理的作用,本试验用来自同批次样本的内部和来自不同批次样本的外部验证集的RPD与RSEP 2个方针衡量猜测作用。验证会集各样本模型猜测值和化学丈量值相联系数Rp和RPD越大,RSEP越小,阐明猜测作用越好。不同光谱预处理下金银花水提进程和醇沉进程近红外光谱近红外模型的猜测成果见表3,4。

表3中以3个批次金银花水提进程的样本光谱直接建模,校对集猜测相对差错为8.36%,挑选与校对集相同一批次金银花重复制剂,该进程中水提液样本绿原酸含量猜测相对差错为4.99%,差错较小,契合快速含量猜测的要求,可是关于不同批次金银花在相同条件下水提样本绿原酸含量猜测的相对差错达32.3%,猜测差错过大,不能用于新批次金银花制剂进程中绿原酸含量的猜测。

DOSC 光谱预处理后,校对集的猜测相对差错由8.36%下降到4.55%,校对集猜测准确度进步;内部验证集的相对差错由4.99%变为8.08%,虽略有升高但仍契合快速含量测定的要求;外部验证集的RSEP由32.3%下降到21.9%,猜测相对差错有所下降,但还未操控在10%以内,猜测差错过大,不能用于新批次制剂进程的猜测。以上数据标明DOSC有必定的光谱布景校对作用,但还不能消除不同批次样本间的一切差错,只是起到了消除布景差错的作用。

运用SBC算法对外部验证集的猜测成果进行校对,猜测相对差错由32.3%下降到7.5%,标明SBC能够显着消除不同批次样本光谱间的系统差错。

对校对集进行DOSC光谱预处理并联合SBC算法对不同批次的外部测验集进行校对,原模型对外部验证集RSEP由32.3%下降到7.3%,RPD由1.17进步到5.19,与仅运用DOSC或SBC一种办法比较,猜测准确度均得到进步,标明DOSC-SBC能够较好的校对和消除不同批次样本的光谱差异,完结金银花水提进程中不同批次间的模型传递。

表4以金银花醇沉液光谱中的8 500~7 300 cm-1波段直接建模,校对集猜测相对差错为7.45%,内部验证会集同批次金银花醇沉进程绿原酸含量猜测相对差错为9.64%,差错较小,契合快速含量猜测的要求,但对外部验证集不同批次样本猜测的相对差错到达237%,猜测差错过大,模型不能用于新批次金银花醇沉进程中绿原酸含量的猜测。

对光谱进行DOSC光谱预处理后,校对集相对猜测差错由7.45%减小至4.43%,内部测验集相对猜测差错由9.64%减小至8.16%,标明DOSC算法消除光谱中与绿原酸含量无关的光谱布景差异,但模型对外部验证会集不同批次样本的猜测相对差错很大,对外部测验集的猜测值进行SBC校对后,猜测相对差错下降到5.25%,标明SBC校对能夠显着消除批次间的系统差错。

对金银花醇沉液进行DOSC光谱预处理,并联合SBC算法对新批次样本的外部测验集进行校对,RSEP由237%下降到4.34%,RPD由0.125进步到6.80,猜测成果优于仅运用DOSC或SBC一种办法的成果,标明DOSC算法消除与方针值无关的光谱布景差异后,再选用SBC办法校对批次间的系统差错,进一步减小模型的猜测差错,DOSC-SBC校对关于批次间的模型传递起到了更为显着的校对作用。

4 定论

本文将DOSC光谱预处理办法与SBC斜率截距校对法相结合,用于金银花水提和醇沉制剂进程中不同批次间的模型传递,对新批次金银花水提和醇沉制剂进程样本的猜测差错别离由28.7%下降到8.33%以及由237%下降到4.34%。2组金银花制剂进程中的数据处理成果标明,DOSC-SBC办法能够有用消除金银花水提或醇沉进程中批次间的差异,完结制剂进程近红外定量模型批次间的传递和制剂进程新批次样本方针成分的快速定量。本办法经过DOSC消除与方针值无关的光谱布景批次间的小差异,然后经过SBC校对批次间系统差错,然后完结近红外定量模型批次间的传递。但本办法依然存在必定的局限性:首要本办法适用于批次间光谱自身的确存在系统差错,假如只存在平行丈量的偶然差错,能够仅用DOSC来减小。其次,原模型的猜测值与样本的参阅值之间存在必定的线性联系,才干运用SBC校对的猜测差错满意快速定量的要求。本研讨提出了一种新的数据处理战略,完结中药制剂进程中近红外定量模型在不同批次间的传递。此外,本办法的完结不需要规范样品,便于在实践制剂进程的运用,为进一步促进中药中试甚至大规模出产进程中有用成分的实时监测和质量操控供给参阅办法。

[参阅文献]

[1] Bouveresse E, Hartmann C,Massart D, et al. Standardization of near-infrared spectrometric instruments [J]. Anal Chem, 1996,68(6):982.

[2] 李庆波,张广军,徐可欣,等. DS算法在近红外光谱多元校对模型传递中的运用 [J].光谱学与光谱剖析,2007,27(5):43.

[3] Wang Y,Veltkamp D, Kowalski B. Multivariate instrument standardization[J]. Anal Chem,1991,63(23):2750.

[4] Wold S,Antti H,Lindgren F,et al. Orthogonal signal correction of near-infrared spectra [J]. Chemom Intell Lab Syst,1998,44(1): 175.

[5] Westerhuis J A, de Jong S, Smilde A K. Direct orthogonal signal correction [J]. Chemom Intell Lab Syst,2001,56:13.

[6] Soldado A, Fearn T,Martinez-Fernandez A,et al . The transfer of NIR calibrations for undried grass silage from the laboratory to on-site instruments: comparison of two approaches [J]. Talanta,2013,105(1):8.

[7] Lin Z Z, Xu B,Yang L,et al. Application of orthogonal space regression to calibration transfer without standards [J]. J Chemometrics,2013,11(27):406.

[8] 中國药典. 一部[S]. 2015:221.

[责任编辑 孔晶晶]

相关资讯
最新新闻
关闭