摘要 針對(duì)多元統(tǒng)計(jì)建模依賴(lài)大樣本的關(guān)鍵限制性問(wèn)題,提出了高階導(dǎo)數(shù)處理結(jié)合向量空間角度量乘性誤差校正的最小二乘回歸方法,并建立了衰減全反射-傅里葉紅外光譜(ATR-FTIR)酸值預(yù)測(cè)模型。以某風(fēng)電機(jī)組96 個(gè)潤(rùn)滑油樣品為案例,基于電位滴定法酸值測(cè)定數(shù)據(jù)實(shí)現(xiàn)了ATR-FTIR 光譜對(duì)酸值的直接校正預(yù)測(cè)。采用模擬雙曲函數(shù)法(SH)得到精密且準(zhǔn)確的四階導(dǎo)數(shù)光譜,通過(guò)分離重疊區(qū)域,提高光譜選擇性;從校正集(48 個(gè)樣本)中按照相關(guān)系數(shù)判斷特征區(qū)域;選取酸值最高樣本作為參比,以角度量轉(zhuǎn)換、1/(1+tan(θ/2))作為光譜的度量關(guān)系,抑制ATR-FTIR 中有效光程變化等因素引起的乘性誤差。經(jīng)過(guò)四階導(dǎo)數(shù)結(jié)合角度量方法的有效預(yù)處理,變量數(shù)由1737 降至8,條件數(shù)由1.85×1015 降至56.34,有效消除了共線(xiàn)性對(duì)最小二乘(OLS)法的影響。直接應(yīng)用OLS 回歸,驗(yàn)證集47 個(gè)樣本的決定系數(shù)(R2)達(dá)到0.981,相對(duì)誤差為–8.38%~8.22%,優(yōu)于常用的偏最小二乘(PLS)方法(R2=0.865,相對(duì)誤差為–27.82%~22.38%),有效的數(shù)據(jù)預(yù)處理顯著提高了預(yù)測(cè)精度。為進(jìn)一步驗(yàn)證樣本數(shù)對(duì)模型的影響,將校正樣本集壓縮至25,驗(yàn)證集擴(kuò)充至70。結(jié)果表明,此模型的變量數(shù)由1737 降為8,條件數(shù)由3.88×1015 降至42.60,驗(yàn)證集的R2=0.972,相對(duì)誤差為–10.80%~12.31%,較PLS 方法(R2=0.724,相對(duì)誤差為–34.26%~53.84%)改善更明顯,表明本方法在更少的建模樣本條件下依然具有較高的預(yù)測(cè)精度,同時(shí)對(duì)乘性誤差干擾具有良好的抑制作用和魯棒性。
關(guān)鍵詞 潤(rùn)滑油;酸值;衰減全反射-傅立葉紅外光譜;高階導(dǎo)數(shù);向量空間角;共線(xiàn)性;最小二乘回歸
動(dòng)力裝置中潤(rùn)滑油主要發(fā)揮潤(rùn)滑、密封、冷卻及動(dòng)力傳遞等作用,對(duì)風(fēng)電機(jī)組長(zhǎng)周期安全穩(wěn)定運(yùn)行具有重要意義[1-2]。酸值是衡量油品老化的一項(xiàng)重要指標(biāo),酸值過(guò)高會(huì)導(dǎo)致機(jī)組部件腐蝕等風(fēng)險(xiǎn)[2]。目前,測(cè)定酸值的方法包括化學(xué)滴定法、電位滴定法和顏色指示劑法等直接測(cè)定法[3-5],以及光譜法和色譜法等間接分析法[6-7]。其中,光譜法具有分析速度快、靈敏度高及易實(shí)現(xiàn)在線(xiàn)分析等優(yōu)勢(shì),尤其是衰減全反射-傅里葉紅外光譜(Attenuated total reflectance-Fourier transform infrared spectroscopy, ATR-FTIR)方法無(wú)需樣品預(yù)處理,可無(wú)損測(cè)定油品光譜后獲得酸值的定性或半定量結(jié)果,得到了廣泛應(yīng)用。ATR-FTIR 結(jié)合化學(xué)計(jì)量學(xué)可獲得更精確的酸值定量分析結(jié)果,其中,特征區(qū)間確定、光譜預(yù)處理和校正算法選擇為影響酸值定量分析精度的重要因素[7-11]。
在多組分復(fù)雜體系樣品(如潤(rùn)滑油)的ATR-FTIR 譜圖中,由于干擾組分與目標(biāo)組分的吸收峰相近甚至完全重疊,導(dǎo)致干擾組分對(duì)特征區(qū)域的選擇影響較大。利用導(dǎo)數(shù)光譜法確定特征區(qū)域的主要優(yōu)勢(shì)是可以消除濁度背景吸收及雜質(zhì)干擾的影響,進(jìn)而提高目標(biāo)組分的選擇性[12-14]。但是,隨著求導(dǎo)階數(shù)的提升,導(dǎo)數(shù)光譜法面臨系統(tǒng)信噪比迅速惡化的問(wèn)題[15]。姚志湘等[16]采用模擬雙曲函數(shù)卷積核對(duì)光譜實(shí)現(xiàn)了更精密的卷積處理,有效提高了光譜高階導(dǎo)數(shù)的計(jì)算精度,為高階導(dǎo)數(shù)光譜法的應(yīng)用提供了重要依據(jù)。
相比于壓片、涂膜或比色池等傳統(tǒng)紅外方法, ATR 可以提供更準(zhǔn)確的透射光程,但光程變化引起的乘性誤差是光譜預(yù)處理過(guò)程需要解決的關(guān)鍵問(wèn)題。目前,常用的乘性誤差校正方法有標(biāo)準(zhǔn)正態(tài)變量變換(Standard normal variate transformation, SNV)和乘性散射校正(Multiplicative scatter correction, MSC)等。Bi 等[17]將近紅外光譜劃分為數(shù)個(gè)等寬的不相交區(qū)域,然后在每個(gè)子區(qū)間進(jìn)行SNV 預(yù)處理,此方法優(yōu)于全局SNV 處理;Rabatel 等[18]提出了一種變量排序歸一化算法,在應(yīng)用SNV 之前為不同波長(zhǎng)變量賦予相應(yīng)權(quán)值;姚志湘等[19]以拉曼光譜為案例,采用空間角度量算法,通過(guò)角度余弦值轉(zhuǎn)換抑制了乘性誤差。
在化學(xué)計(jì)量學(xué)中,多變量校正的常用算法包括最小二乘法(Ordinary least square, OLS)、典型相關(guān)分析、主成分分析和偏最小二乘(Partial least squares, PLS)等[20–23]。其中, OLS 的主要特點(diǎn)是所需建模樣本數(shù)少且計(jì)算簡(jiǎn)單,但如果多變量體系存在顯著共線(xiàn)性,過(guò)大的條件數(shù)將導(dǎo)致模型的精確性和穩(wěn)健性顯著劣化;PLS 是目前多變量建模最常用的方法,通常采用正交的、對(duì)因變量解釋程度和自變量信息占比最高的主成分(潛變量)消除共線(xiàn)性,同時(shí)降低弱相關(guān)因素的干擾。但是, PLS 受限于一定條件,由于PLS可解釋性不高,需要滿(mǎn)足統(tǒng)計(jì)一致性,較少的樣本數(shù)量會(huì)使得PLS 模型的合理性和普適性存疑,導(dǎo)致定量分析精度低及模型泛化能力差[20–23]。在實(shí)際應(yīng)用中,對(duì)于高度分散安置的風(fēng)電機(jī)組,采集統(tǒng)一的大量潤(rùn)滑油樣本較困難,導(dǎo)致檢測(cè)成本高,因此傳統(tǒng)的PLS 方法在小樣本數(shù)風(fēng)電機(jī)組酸值預(yù)測(cè)模型中不再具有優(yōu)勢(shì),需要采用更確定和更高程度的可解釋途徑提高預(yù)測(cè)模型的針對(duì)性和準(zhǔn)確性,進(jìn)而實(shí)現(xiàn)小樣本數(shù)條件下的精確定量分析。
紅外光譜的信息量大,其信號(hào)的選擇性較紫外光譜和近紅外光譜更佳。與PLS 相比, OLS 在可解釋性、穩(wěn)健性和泛化能力等方面更具優(yōu)勢(shì)。如果對(duì)ATR-FTIR 光譜進(jìn)行有效的數(shù)據(jù)預(yù)處理,降低條件數(shù),使其自變量共線(xiàn)性改善至可接受程度,采用OLS 建??梢詫?shí)現(xiàn)在更小的校正集樣本條件下得到較PLS更精確的定量分析結(jié)果。本研究以風(fēng)電場(chǎng)機(jī)組潤(rùn)滑油電位滴定法測(cè)定的酸值和ATR-FTIR 譜圖構(gòu)建樣本集,采用四階導(dǎo)數(shù)結(jié)合空間角度量矩陣的預(yù)處理過(guò)程,通過(guò)OLS 算法建立了ATR-FTIR 譜圖與酸值之間的定量關(guān)系。
1 實(shí)驗(yàn)部分
1.1 儀器與試劑
SYD-264B 石油產(chǎn)品自動(dòng)酸值試驗(yàn)器(上海昌吉地質(zhì)儀器有限公司),配有玻璃pH 電極和飽和汞電極;WQF-530A 傅里葉變換紅外光譜儀(北京北分瑞利分析儀器集團(tuán)有限責(zé)任公司),配有液體ATR 附件和MainFTOS Suite 數(shù)據(jù)處理工作站。
無(wú)水乙醇(C2H6O)、異丙醇(C3H8O)、甲苯(C7H8O)和鄰苯二甲酸氫鉀(C8H5KO4)(分析純,天津市致遠(yuǎn)化學(xué)試劑有限公司);KOH(分析純,國(guó)藥集團(tuán)化學(xué)試劑有限公司)。采集陜西某風(fēng)電場(chǎng)UP115-2000 型風(fēng)電機(jī)組96 個(gè)潤(rùn)滑油樣品,編號(hào)為A1~A96。
1.2 實(shí)驗(yàn)方法
1.2.1 電位滴定法測(cè)定酸值
采用電位滴定法測(cè)定風(fēng)電機(jī)組潤(rùn)滑油樣品的酸值。首先,考察了無(wú)水乙醇、石油醚和甲苯-異丙醇-水(100∶99∶1, V/V)混合溶液3 種溶劑對(duì)潤(rùn)滑油樣品酸值測(cè)定的影響。選擇干擾影響最小的無(wú)水乙醇作為潤(rùn)滑油樣品的溶劑,具體測(cè)定方法參照國(guó)家標(biāo)準(zhǔn)(GB/T 7304—2014)[3]。每個(gè)樣品重復(fù)測(cè)試3 次,分析結(jié)果取平均值。
1.2.2 ATR-FTIR譜圖采集
設(shè)置ATR-FTIR 參數(shù),分辨率為4.0 cm–1, 掃描32 次。每次潤(rùn)滑油樣品譜圖測(cè)定前,采集空氣本底作為背景光譜以保證穩(wěn)定的較高信噪比。依次取1.00 mL 樣品注入ATR 附件樣品池中,確保樣品均勻且無(wú)氣泡。每個(gè)樣品重復(fù)測(cè)試3 次,分析結(jié)果取平均值。
1.2.3 實(shí)驗(yàn)數(shù)據(jù)測(cè)試結(jié)果
電位滴定法測(cè)定的酸值結(jié)果及最大誤差限見(jiàn)表1,對(duì)應(yīng)的ATR-FTIR 吸光度譜圖見(jiàn)圖1。其中, 5 個(gè)區(qū)域(a、b、c、d 和e)出現(xiàn)明顯差異,分別對(duì)應(yīng)于亞甲基面內(nèi)搖擺振動(dòng)、硫磷等化合物及各種添加劑、甲基碳?xì)滏I的彎曲振動(dòng)、羧基的碳氧雙鍵伸縮振動(dòng)和甲基與亞甲基碳?xì)滏I的伸縮振動(dòng)區(qū)域。
2 建模方法
在多組分復(fù)雜體系樣本的ATR-FTIR 譜圖中,存在與目標(biāo)組分相近或完全重疊的干擾組分吸收峰,特征區(qū)域受干擾組分影響較大。同時(shí), ATR-FTIR 光程受樣本影響大,易引起乘性誤差,波數(shù)間存在嚴(yán)重共線(xiàn)性,影響校正算法的可解釋性、穩(wěn)健性及泛化能力。
2.1 減小干擾組分影響的高階導(dǎo)數(shù)光譜方法
與經(jīng)典光譜分析類(lèi)似,潤(rùn)滑油等多組分復(fù)雜體系樣品的ATR-FTIR 導(dǎo)數(shù)光譜的光譜導(dǎo)數(shù)值與組分濃度之間依然具有線(xiàn)性可加性,這是進(jìn)行定量分析的基礎(chǔ)[14]。光譜求高階導(dǎo)后,主峰峰寬減小,陡峭程度增加,提高了目標(biāo)組分的選擇性[12,24-25]。根據(jù)相關(guān)系數(shù)判據(jù),得到準(zhǔn)確的特征區(qū)域,減小樣本差異性的影響。針對(duì)高階導(dǎo)數(shù)同時(shí)會(huì)引起系統(tǒng)信噪比減小的問(wèn)題,本研究采用文獻(xiàn)[16]提出的求導(dǎo)方法,以提高求導(dǎo)精度,得到更精確的高階導(dǎo)數(shù)光譜。
2.2 抑制乘性干擾的向量空間角度量方法
ATR-FTIR 光譜預(yù)處理過(guò)程的關(guān)鍵是抑制由光程變化引起的乘性誤差。對(duì)于ATR-FTIR,吸光度與酸值相關(guān)組分濃度之間的關(guān)系近似表示為:
A = Dc + d (1)
其中, A為吸光度; 為吸光度系數(shù),主要受組分和波長(zhǎng)點(diǎn)等因素影響;D為有效光程;c為樣本與酸值相關(guān)組分的濃度;d為測(cè)量過(guò)程中產(chǎn)生的加性誤差,包括基線(xiàn)漂移、噪聲及儀器誤差等。D是產(chǎn)生乘性誤差的主要原因,可由式(2)計(jì)算[11]:
其中, 為入射光波長(zhǎng), N 為反射次數(shù), n1為ATR 晶體折射率, 為入射角, ns為樣品折射率。
根據(jù)式(2),對(duì)于同一個(gè)ATR 裝置, N 、和n1為定值, D只與和ns有關(guān),不同潤(rùn)滑油樣品的ns 不同,導(dǎo)致有效光程不同,產(chǎn)生乘性誤差,影響吸光度與組分濃度的線(xiàn)性關(guān)系。
對(duì)于n組分、P樣本數(shù)、m波長(zhǎng)點(diǎn)的多組分復(fù)雜油品體系, 考慮ns對(duì)光程的影響, 第i個(gè)樣本的吸光度為:
Ai = Diciε + di (3)
2.3 降低共線(xiàn)性的高階導(dǎo)數(shù)結(jié)合向量空間角度方法
在ATR-FTIR 譜圖中,各個(gè)波數(shù)相互依賴(lài)性強(qiáng)。當(dāng)樣品中組分濃度改變時(shí),各波數(shù)的吸光度,尤其相鄰波數(shù)處的吸光度往往同時(shí)按某個(gè)比例增加或降低,導(dǎo)致嚴(yán)重共線(xiàn)性問(wèn)題[26]。
對(duì)于高階導(dǎo)數(shù)光譜,目標(biāo)組分與干擾組分分離,降低了組分信息重疊引起的共線(xiàn)性。在較小的區(qū)間范圍(r1, r2)內(nèi),吸光度變化很小,共線(xiàn)性嚴(yán)重,通過(guò)在每個(gè)小區(qū)間內(nèi)計(jì)算與參比樣本相應(yīng)的角度量值1/(1 + tan(θ/2)) (記為 ),可減小相鄰波數(shù)的共線(xiàn)性。將原p × m的v階導(dǎo)數(shù)光譜矩陣轉(zhuǎn)化為p × r的角度量矩陣,即:
式(12)所示的變換過(guò)程解決了由于Di不同引起的乘性誤差問(wèn)題,降低了原光譜的維數(shù),并減小了原自變量的共線(xiàn)性問(wèn)題,保證了小樣本數(shù)時(shí)OLS 回歸模型的定量分析精度。
3 結(jié)果與討論
采用上述建模方法考察1.2.3 節(jié)中潤(rùn)滑油樣品酸值的預(yù)測(cè)效果,并與常用建模方法PLS+SNV 比較,驗(yàn)證本研究建立的算法的優(yōu)勢(shì)。
3.1 偏最小二乘擬合
選取樣本A1~A49 為校正樣本集、A50~A96 為驗(yàn)證樣本集。采用SNV 減小乘性誤差,一階導(dǎo)減小加性誤差后,在ATR-FTIR 光譜全波段下,主成分?jǐn)?shù)為1~7 時(shí),采用偏最小二乘回歸(Partial least squaresregression, PLSR)建模,得到校正集與驗(yàn)證集決定系數(shù)(Determination coefficient, R2),其中,主成分?jǐn)?shù)為3時(shí)結(jié)果相對(duì)較好,但所得結(jié)果的相對(duì)誤差仍過(guò)大(表2)。為減小誤差,重新選擇特征區(qū)域建模。根據(jù)光譜變量選擇的變量投影重要性方法(Variable importance in projection, VIP),計(jì)算出主成分?jǐn)?shù)為3 時(shí)每個(gè)波數(shù)的VIP 值(圖2)。
選擇993.16~1321.00 cm–1 和1658.48~1899.54 cm–1 兩個(gè)對(duì)酸值解釋程度較高的區(qū)域?yàn)樘卣鲄^(qū)間,當(dāng)主成分?jǐn)?shù)為1~7 時(shí), PLSR 結(jié)果見(jiàn)表3。選取5 個(gè)主成分,其PLSR 結(jié)果見(jiàn)電子版文后支持信息表S1,驗(yàn)證集決定系數(shù)為0.865,相對(duì)誤差為–27.82%~22.38%,仍存在較大的定量誤差(gt;27%)。
3.2 空間角度量結(jié)合高階導(dǎo)數(shù)優(yōu)化最小二乘
依據(jù)本建模方法,選取樣本A1~A48 為校正集、A50~A96 為驗(yàn)證集,為了使角度量矩陣與酸值之間具有最佳的線(xiàn)性關(guān)系,取酸值最高的A49 為參比樣本。
首先考察了對(duì)光譜進(jìn)行不同階導(dǎo)數(shù)后的定量分析效果。分別求取二、三、四和五階導(dǎo)數(shù),結(jié)果見(jiàn)表4,二、三階導(dǎo)階數(shù)較低,導(dǎo)數(shù)光譜選擇性下降;五階導(dǎo)階數(shù)較高,噪聲影響增大,信噪比下降;四階導(dǎo)數(shù)光譜有最優(yōu)的預(yù)測(cè)效果。
進(jìn)一步考察了四階導(dǎo)數(shù)對(duì)光譜重疊信息的分離效果。樣本A1~A96 的導(dǎo)數(shù)光譜見(jiàn)圖3,分別在48(A1~A48)和25(A1~A25)個(gè)校正樣本條件下,對(duì)1725 cm–1 處羧酸C=O 振動(dòng)區(qū)域和1150 cm–1 附近的硫化產(chǎn)物以及氧化物(羧酸鹽)的重疊區(qū)域的一階導(dǎo)數(shù)光譜(圖3A)與四階導(dǎo)數(shù)光譜(圖3B)進(jìn)行PLS 分析,所得前4 個(gè)主成分對(duì)光譜與酸值的貢獻(xiàn)占比見(jiàn)表5。當(dāng)校正樣本數(shù)為48 時(shí),一階和四階導(dǎo)數(shù)光譜的PLS 分析結(jié)果表明,每個(gè)主成分具有相似的占比,說(shuō)明在樣本數(shù)正常的情況下,即使存在信息重疊,所得PLS 主成分仍具有一定的普適性。但校正樣本數(shù)為25 時(shí),一階導(dǎo)數(shù)光譜的第一個(gè)主成分對(duì)酸值的解釋占比達(dá)到46.29%,含有原光譜49.43%的信息,其余信息對(duì)酸值的解釋占比較低,顯然由于一階導(dǎo)數(shù)光譜未能將重疊區(qū)域完全分離,因此在樣本個(gè)數(shù)較少時(shí), PLS 所得主成分的普適性較低,歪曲了真實(shí)信息。四階導(dǎo)數(shù)后,第一、二主成分對(duì)酸值的解釋占比都較高,并且所占光譜信息也較高,分別對(duì)應(yīng)于1725 和1150 cm–1 處兩個(gè)特征區(qū)域,第三主成分對(duì)酸值解釋占比很低,卻占據(jù)了一定的光譜信息,對(duì)應(yīng)于分離后的干擾區(qū)域,其余成分的占比都較低,對(duì)應(yīng)于噪聲部分。因此,在小樣本條件下,四階導(dǎo)數(shù)能更有效地分離重疊信息,消除共存干擾組分,得到與實(shí)際相符的特征區(qū)域。
綜上,四階導(dǎo)數(shù)光譜在具有較高定量精度的同時(shí),仍能準(zhǔn)確提高光譜選擇性,分離重疊信息。在四階導(dǎo)數(shù)光譜中,每個(gè)波數(shù)與酸值的相關(guān)系數(shù)的絕對(duì)值計(jì)算結(jié)果如圖4所示。取相關(guān)系數(shù)大于0.6的兩個(gè)區(qū)域,結(jié)合原光譜圖將其細(xì)分為3 個(gè)區(qū)域980.304~1033.66 cm–1、1133.94~1174.44 cm–1 和1697.05~1731.76 cm–1,分別對(duì)應(yīng)于1000 cm–1 附近羧基C—O 伸縮振動(dòng);1150 cm–1 附近硫化產(chǎn)物以及氧化物(羧酸鹽)的重疊峰,經(jīng)四階導(dǎo)數(shù)后,其重疊區(qū)域被分開(kāi);1725 cm–1 附近羧基的C=O 伸縮振動(dòng)[7]。其中,羧基C—O 振動(dòng)和C=O 振動(dòng)為同一官能團(tuán)羧基的不同振動(dòng)區(qū)域,具有極高的相關(guān)性,若同時(shí)選取作為建模區(qū)域,則OLS 的條件數(shù)增大,定量分析精度降低,故選取和羧基紅外吸收最強(qiáng)的區(qū)域1658.482~1754.905 cm–1 與硫氧化物區(qū)域1108.869~1205.292 cm–1 作為擬合區(qū)間。共102 個(gè)波數(shù)點(diǎn)以12 個(gè)波點(diǎn)長(zhǎng)度為移動(dòng)窗口,將四階導(dǎo)數(shù)光譜劃分為8個(gè)區(qū)間,其中,每個(gè)區(qū)間與參比光譜區(qū)間之間對(duì)應(yīng)的角度值為θ 1 … θ8,將其轉(zhuǎn)化為1 / +(tan( θ1/2)),…, 1/ (1 + tan(θ 8 /2)) 并表示成角度量矩陣Φ = (Φ 1,…,Φ 8),對(duì)此矩陣應(yīng)用OLS擬合得到度量矩陣與酸值之間的回歸系數(shù)β=(–0.522, 4.061, –5.048, 1.929, –0.647, 1.154, –1.311, 2.683),β0 = –1.078。根據(jù)模型可知酸值C和之間的關(guān)系如式(13)所示,所得驗(yàn)證集結(jié)果見(jiàn)電子版文后支持信息表S2。
C =βΦ T + β0(13)
3.3 模型對(duì)比及驗(yàn)證
與PLS+SNV 相比(圖5),本方法將驗(yàn)證集R2從0.865 提至0.981,相對(duì)誤差從–27.82%~22.38%減至–8.38%~8.22%,提升效果明顯。原光譜矩陣X 條件數(shù)為1.85×1015,共線(xiàn)性嚴(yán)重,求逆時(shí)舍入誤差較大。四階導(dǎo)數(shù)光譜空間角度量光譜,條件數(shù)為56.34,求逆時(shí)舍入誤差較小,對(duì)OLS 精確性影響小。
為了驗(yàn)證小樣本下模型的精確性,將校正集壓縮至25 個(gè)樣本,驗(yàn)證集增至70 個(gè)樣本,求四階導(dǎo)數(shù),以12 個(gè)波數(shù)為1 個(gè)區(qū)間,共8 個(gè)區(qū)間,計(jì)算角度量矩陣,條件數(shù)由3.88 × 1015 降至42.60,滿(mǎn)足OLS 計(jì)算要求。與PLS+SNV對(duì)比的結(jié)果如圖6所示,驗(yàn)證集R2 = 0.972,相對(duì)誤差為–10.80%~12.31%,定量分析精度顯著優(yōu)于PLS+SNV算法(驗(yàn)證集R2 = 0.724,相對(duì)誤差為–34.26%~53.84%),并且不會(huì)在某個(gè)驗(yàn)證樣本出現(xiàn)較大的誤差。但是,由于校正集樣本數(shù)減少,在組分復(fù)雜的風(fēng)電場(chǎng)潤(rùn)滑油體系中,信息冗余小于48 個(gè)校正集樣本,因此定量分析精確度低于48 個(gè)校正樣本模型。
進(jìn)一步考察了25 個(gè)校正樣本數(shù)下PLS+一階導(dǎo)+SNV、PLS+四階導(dǎo)+SNV、PLS+四階導(dǎo)+空間角以及OLS+四階導(dǎo)+空間角四種算法結(jié)果。由表6 可知,在PLS 基礎(chǔ)上只引入四階導(dǎo)后,分析結(jié)果改善并不明顯,繼續(xù)加入空間角,當(dāng)主成分?jǐn)?shù)與角度量矩陣的變量相同時(shí),結(jié)果等同于OLS,此時(shí)PLS 失去了必要性,當(dāng)主成分?jǐn)?shù)減小時(shí),建模效果相應(yīng)降低。由于PLS 經(jīng)過(guò)奇異值分解后,可解釋性較差,若解決了共線(xiàn)性問(wèn)題,同樣的預(yù)處理?xiàng)l件下, OLS 較PLS 更具優(yōu)勢(shì)。
4 結(jié)論
風(fēng)電機(jī)組潤(rùn)滑油劣化因素復(fù)雜,影響了樣本統(tǒng)計(jì)的一致性,采用PLS 預(yù)測(cè)時(shí),結(jié)果不理想。對(duì)選取的96 個(gè)樣本(校正集49 個(gè),驗(yàn)證集47 個(gè))進(jìn)行PLS 預(yù)測(cè),預(yù)測(cè)結(jié)果的R2 為0.865,相對(duì)誤差大于27%,模型無(wú)法獲得理想的分析結(jié)果。采用四階導(dǎo)數(shù)結(jié)合向量空間角度量?jī)?yōu)化OLS 回歸方法對(duì)ATR-FTIR 譜圖進(jìn)行分析,以期定量預(yù)測(cè)樣本酸值。取48 個(gè)校正樣本、47 個(gè)驗(yàn)證樣本和1 個(gè)參比樣本,結(jié)果表明,模擬雙曲函數(shù)法能很好地抑制噪聲干擾,提升求導(dǎo)精度;四階導(dǎo)數(shù)處理后可以準(zhǔn)確地選擇出真實(shí)的酸值特征區(qū);采用空間角度量方法,使用1/(1+tan(θ/2))作為光譜度量關(guān)系,有效抑制了ATR-FTIR中的乘性誤差;將兩種預(yù)處理步驟相結(jié)合,顯著降低了體系共線(xiàn)性,采用OLS 回歸,預(yù)測(cè)集R2 提升至0.981,最大相對(duì)誤差小于9%,預(yù)測(cè)性能得到了顯著改善。當(dāng)大幅壓縮校正集(樣本數(shù)25)后, 70 個(gè)驗(yàn)證集樣本R2 仍能達(dá)到0.972,且最大相對(duì)誤差小于13%,顯著優(yōu)于PLS 方法。本研究提出的數(shù)據(jù)預(yù)處理步驟可以充分發(fā)揮OLS的優(yōu)勢(shì),有效避免統(tǒng)計(jì)建??山忉屝圆顚?dǎo)致的大樣本依賴(lài)性。
References
[1] HAN Jian, LI Ke-Xin, WANG Lei, CHEN Dong-Mei, WANG Li, ZHANG Yan. Lubr. Oil, 2023, 38(5): 1-5.
韓健, 歷可鑫, 王雷, 陳冬梅, 王莉, 張妍. 潤(rùn)滑油, 2023, 38(5): 1-5.
[2] LIU Jing-Jing, LI Ze-Yi, YANG Ce, CHAO Wei, NI Meng. Lubr. Oil, 2023, 38(1): 53-56.
劉靜靜, 李澤乙, 楊策, 晁衛(wèi), 倪萌. 潤(rùn)滑油, 2023, 38(1): 53-56.
[3] GB/T 7304—2014. Standard Test Method for Acid Number of Petroleum Products by Potentiometric Titration. National Standards of the People′s Republic of China.
石油產(chǎn)品酸值的測(cè)定電位滴定法. 中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn). GB/T 7304—2014.
[4] GB/T 264—1983. Petroleum Products—Determination of Acid Number. National Standards of the People′s Republic of China.
石油產(chǎn)品酸值測(cè)定法. 中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn). GB/T 264—1983.
[5] GB/T 4945—2002. Standard Test Method for Acid and Base Number of Petroleum Products and Lubricants by Colour-Indicator Titration. National Standards of the People′s Republic of China.
石油產(chǎn)品和潤(rùn)滑劑酸值和堿值測(cè)定法(顏色指示劑法). 中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn). GB/T 4945—2002.
[6] MACIAN V, TORMOS B, GARCIA-BARBERA A, TSOLAKIS A. Chemom. Intell. Lab. Syst. , 2021, 208: 104215.
[7] TIAN Gao-You, CHU Xiao-Li, YI Ru-Juan, XIONG Chun-Hua, SU Bin. Lubricants Oil Infrared Spectrum Analysis Technology. Beijing: Chemical Industry Press, 2014: 1-11, 56-60, 168-169, 172-193, 284.
田高友, 褚小立, 易如娟, 熊春華, 粟斌. 潤(rùn)滑油中紅外光譜分析技術(shù). 北京: 化學(xué)工業(yè)出版社, 2014: 1-11, 56-60,168-169, 172-193, 284.
[8] HU Yu-Zhu. Concise Tutorial on Analytical Chemistry. Beijing: Science Press, 2012: 4-7.
胡育筑. 分析化學(xué)簡(jiǎn)明教程(第3版). 北京: 科學(xué)出版社, 2012: 4-7.
[9] WANG H P, CHEN P, DAI J W, LIU D, LI J Y, XU Y P, CHU X L. TrAC, Trends Anal. Chem. , 2022, 153: 116648.
[10] CHU Xiao-Li. Chemometric Methods in Modern Spectral Analysis. Beijing: Chemical Industry Press, 2022: 1-14, 36-37,64-71, 79-96, 122, 144-151, 162-171.
褚小立.現(xiàn)代光譜分析中的化學(xué)計(jì)量學(xué)方法.北京:化學(xué)工業(yè)出版社,2022:1-14,36-37,64-71,79-96,122,144-151,162-171.
[11] CHU Xiao-Li. Molecular Spectroscopy Analytical Technology Combined with Chemometrics and Its Applications. Beijing:Chemical Industry Press, 2011: 12-14, 17-23, 54-59.
褚小立. 化學(xué)計(jì)量學(xué)方法與分子光譜分析技術(shù). 北京: 化學(xué)工業(yè)出版社, 2011: 12-14, 17-23, 54-59.
[12] ROJAS F S, OJEDA C B. Anal. Chim. Acta, 2009, 635(1): 22-44.
[13] HUANG Jun-Li, BAO Zhi-Yu. Ultraviolet Absorption Spectrometry and Its Application. Beijing: Chemical Industry Press,1992: 100-102.
黃君禮, 鮑治宇. 紫外吸收光譜法及其應(yīng)用. 北京: 中國(guó)科學(xué)技術(shù)出版社, 1992: 100-102.
[14] KARPI?SKA J. Talanta, 2004, 64(4): 801-822.
[15] O’HAVER T C, BEGLEY T. Anal. Chem. , 1981, 53(12): 1876-1878.
[16] YAO Z X, YAO J, SU H. Chemom. Intell. Lab. Syst. , 2023, 234: 104754.
[17] BI Y M, YUAN K L, XIAO W Q, WU J Z, SHI C Y, XIA J, CHU G H, ZHANG G X, ZHOU G J. Anal. Chim. Acta, 2016,909: 30-40.
[18] RABATEL G, MARINI F, WALCZAK B, ROGER J M. J. Chemom. , 2020, 34(2): e3164.
[19] YAO Zhi-Xiang, SUN Zeng-Qiang, SU Hui, YUAN Hong-Fu. Spectrosc. Spectral Anal. , 2016, 36(2): 419-423.
姚志湘, 孫增強(qiáng), 粟暉, 袁洪福, 光譜學(xué)與光譜分析, 2016, 36(2): 419-423.
[20] OLIVIERI A C. Introduction to Multivariate Calibration: A Practical Approach. Switzerland: Springer Nature Switzerland AG, 2018: 39-50, 57-68, 103-119.
[21] BRERETON R G. Chemometrics: Data Driven Extraction for Science. Wiley Press, 2018: 102-118, 265-294.
[22] MARK H, WORKMAN J. Chemometrics in Spectroscopy. Academic Press, 2018: 27-51, 119-143.
[23] WANG Hui-Wen. Partial Least-Squares Regression-Method and Application. Beijing: National Defense Industry Press,1999: 67-70, 91-106, 150-169.
王惠文. 偏最小二乘回歸方法及其應(yīng)用. 北京: 國(guó)防工業(yè)出版社, 1999: 67-70, 91-106, 150-169.
[24] OPPENHEIM A V, WILLSKY A S, NAWAB S H. Signals and Systems. Translated by LIU Shu-Tang. Beijing: Publishing House of Electronics Industry, 2013: 180-210.
OPPENHEIM A V, WILLSKY A S, NAWAB S H. 信號(hào)與系統(tǒng)(第二版). 劉樹(shù)棠譯. 北京: 電子工業(yè)出版, 2013: 180-210.
[25] ZHENG Nan-Ning. Brief Tutorial on Digital Signal Processing. Xi′an: Xi′an Jiaotong University Press, 2014: 6-27.
鄭南寧. 數(shù)字信號(hào)處理簡(jiǎn)明教程. 西安: 西安交通大學(xué)出版社, 2014: 6-27.
[26] DU Yi-Ping, PAN Tie-Ying, ZHANG Yu-Lan. Chemometrics Application. Beijing: Chemical Industry Press, 2008: 138-147.
杜一平, 潘鐵英, 張玉蘭. 化學(xué)計(jì)量學(xué)應(yīng)用. 北京: 化學(xué)工業(yè)出版社, 2008: 138-147.
國(guó)家自然科學(xué)基金聯(lián)合基金重點(diǎn)項(xiàng)目(No. U1910215)資助。
支持信息