張諾涵,趙 樂,王 迪,劉 雨,王洪波,李蓓蓓,梁友艷,郭軍偉*
1.中國煙草總公司鄭州煙草研究院,鄭州高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)楓楊街2 號(hào) 450001 2.山東中煙工業(yè)有限責(zé)任公司青島卷煙廠,山東省青島市嶗山區(qū)株洲路137 號(hào) 266300
近紅外(Near infrared,NIR)是一種快速、高效、無損的分析技術(shù),目前在煙草行業(yè)廣泛應(yīng)用于煙葉化學(xué)成分分析[1]、煙葉質(zhì)量評(píng)價(jià)[2]、打葉模塊組配[3]、復(fù)烤片煙質(zhì)量均一性控制[4]、卷煙原輔材料質(zhì)量控制[5]和卷煙配方維護(hù)與設(shè)計(jì)[6]等。由于光學(xué)系統(tǒng)和元器件的微小差異,在一臺(tái)近紅外光譜儀上構(gòu)建的預(yù)測(cè)模型并不能直接應(yīng)用到另外一臺(tái)近紅外光譜儀上。要將近紅外預(yù)測(cè)模型應(yīng)用到其他光譜儀上,必須進(jìn)行模型轉(zhuǎn)移。預(yù)測(cè)模型轉(zhuǎn)移能夠避免繁瑣重復(fù)的建模過程,實(shí)現(xiàn)預(yù)測(cè)模型利用的最大化,實(shí)現(xiàn)分析數(shù)據(jù)的統(tǒng)一、可比,對(duì)大數(shù)據(jù)積累與分析挖掘具有重要意義[7]。
目前,近紅外模型轉(zhuǎn)移方法主要有對(duì)模型參數(shù)校正的算法、對(duì)預(yù)測(cè)結(jié)果校正的算法和對(duì)光譜校正的算法3 種[8]。其中,轉(zhuǎn)移效果最好的是光譜校正法,且光譜校正法非常有利于網(wǎng)絡(luò)化連接的儀器群,對(duì)于直接利用近紅外光譜圖進(jìn)行數(shù)據(jù)分析而不使用化學(xué)成分預(yù)測(cè)模型的應(yīng)用場(chǎng)景,這種光譜校正方法也可以將子機(jī)群的光譜統(tǒng)一到可比基礎(chǔ)之上,具有很大優(yōu)勢(shì)。目前,煙草行業(yè)多采用基于光譜校正的模型轉(zhuǎn)移方法中的分段直接校正法[9](Piecewise direct standard,PDS)和光譜空間轉(zhuǎn)換[10](Spectral space transformation,SST)等,而SST 在重組光譜時(shí)需要根據(jù)經(jīng)驗(yàn)選取適當(dāng)?shù)闹鞒煞謹(jǐn)?shù),同時(shí)PDS 法也需要根據(jù)經(jīng)驗(yàn)選擇最優(yōu)窗口大小及主成分?jǐn)?shù)。因此,建立了一種基于光譜校正模型轉(zhuǎn)移的Q 型因子光譜轉(zhuǎn)移法(Q-factor spectral transformation,QFST),該方法根據(jù)類間可分性原則,將主機(jī)和子機(jī)光譜的眾多原始變量歸結(jié)為幾個(gè)綜合因子,以此構(gòu)建兩者的轉(zhuǎn)換關(guān)系,旨在以最小的信息損失實(shí)現(xiàn)對(duì)不同儀器間光譜的校正。
2021年全國各中煙工業(yè)有限責(zé)任公司的醇化片煙樣品,共1 012個(gè);采用Kennard-Stone(KS)方法[11]篩選出199個(gè)具有代表性的醇化片煙樣品。
主機(jī)M1 和子機(jī)S1、S2 均為Antaris Ⅱ型傅里葉變換近紅外光譜儀配并備積分球漫反射采樣系統(tǒng)、ICS 6000 離子色譜儀(美國Thermo Scientific 公司);主機(jī)M2 和子機(jī)S3 為Tango Ⅱ型傅里葉變換近紅外光譜儀(德國Bruker 公司);ZM200 型粉碎機(jī)(德國Retsch 公司);BSA124S 型電子天平(感量0.000 1 g,德國Satorious 公司);TRACE 1310/TSQ QUANTUM XLS 氣相色譜-串聯(lián)質(zhì)譜聯(lián)用儀(GC-MS/MS,美國Thermo Fisher Scientific 公司);AA3 連續(xù)流動(dòng)分析儀(德國BRAN+RUBBE 公司);A300全自動(dòng)氨基酸分析儀(德國MembraPure GmbH公司);1200 液相色譜儀(美國Agilent 公司);AB Sciex Triple TOF TM 4600 質(zhì)譜儀(美國Applied Biosystems公司);UPLC-CLASS超高效液相色譜系統(tǒng)(美國Waters 公司);7500 型電感耦合等離子體質(zhì)譜儀(ICP-MS,美國Agilent 公司);702 SM Titrino pH計(jì)(瑞士Metrohm公司)。
1.2.1 樣品處理與化學(xué)指標(biāo)檢測(cè)
所有煙草樣品均按照行業(yè)標(biāo)準(zhǔn)[12]干燥處理。干燥后的樣品通過帶孔徑0.250 mm(60 目)分篩網(wǎng)的粉碎機(jī)粉碎研磨,混勻后裝入密封袋。采用行業(yè)標(biāo)準(zhǔn)或文獻(xiàn)方法測(cè)定樣品的總植物堿[13]、還原糖和總糖[14]、總氮[15]、鉀[16]和氯[17]6種常規(guī)化學(xué)指標(biāo)、12種有機(jī)酸[18]、21種氨基酸[19]、17種Amadori化合物[20]、6種多酚類化合物[21]、二氯甲烷提取物[22]、淀粉[23]、鎂離子和鈣離子[24]、硫酸根和磷酸根[25]、茄尼醇[26]以及pH[27]等共70種化學(xué)指標(biāo)。
1.2.2 光譜采集與預(yù)處理
主機(jī)和子機(jī)的光譜采集參數(shù):儀器的掃描范圍為4 000~10 000 cm-1,掃描次數(shù)為64次,光譜分辨率為8 cm-1。
光譜預(yù)處理方法:采用一階求導(dǎo)和Savitzky-Golay卷積平滑處理,平滑窗口為17,平滑階數(shù)為2。
1.2.3 Q型因子光譜轉(zhuǎn)移法(QFST)
因子分析法是將眾多的原始變量歸結(jié)為少數(shù)幾個(gè)因子變量的一種多變量統(tǒng)計(jì)分析方法[28]。該方法通過將原始變量中相關(guān)性較高的變量歸為同一類別,其中,每個(gè)類別代表一個(gè)基本結(jié)構(gòu),即公共因子。通過使用適量的公共因子的線性函數(shù)與特殊因子的組合描述原始的每個(gè)分量。
因子分析模型有R 型和Q 型之分,R 型、Q 型分析的對(duì)象不同。R型因子分析是研究指標(biāo)之間的相互關(guān)系,實(shí)現(xiàn)對(duì)樣品的分類;而Q型因子分析主要是分析樣品間的相似程度,并實(shí)現(xiàn)對(duì)變量的分類[29]。由于煙葉樣品間的相似性很強(qiáng),故可采用Q 型因子分析方法提煉具有代表性的公共因子。
Q型因子光譜轉(zhuǎn)移法(QFST)就是通過采用Q型因子分析分別得到煙葉樣品在主機(jī)和子機(jī)上的公共因子,并重組其相應(yīng)的光譜矩陣,從而得到主機(jī)和子機(jī)之間的光譜轉(zhuǎn)換關(guān)系矩陣,實(shí)現(xiàn)主機(jī)和子機(jī)間的光譜轉(zhuǎn)移。具體計(jì)算過程如下:
求主機(jī)和子機(jī)的因子載荷矩陣和因子得分矩陣。采用主因子法,即主成分法對(duì)主機(jī)光譜Xmori和子機(jī)光譜Xsori進(jìn)行估計(jì),得到因子載荷矩陣和因子得分:
式中,Xmori—主機(jī)光譜;Xsori—子機(jī)光譜;光譜矩陣Xmori和Xsori的每行表示同一組標(biāo)準(zhǔn)樣品在主機(jī)和子機(jī)上測(cè)量的相應(yīng)光譜;Amori—主機(jī)因子載荷矩陣;Asori—子機(jī)因子載荷矩陣;Fmori—主機(jī)因子得分矩陣;Fsori—子機(jī)因子得分矩陣;Em—主機(jī)特殊因子矩陣;Es—子機(jī)特殊因子矩陣;上標(biāo)“T”表示轉(zhuǎn)置。
重組主機(jī)和從機(jī)的光譜矩陣。采用最大方差正交旋轉(zhuǎn)法,將變量進(jìn)行分類,即因子載荷的絕對(duì)值向0和1兩極分化,再通過矩陣計(jì)算得到具有代表性的公共因子,進(jìn)一步選擇主因子數(shù)重組得到新的主機(jī)光譜矩陣Xm和子機(jī)光譜矩陣Xs:
式中,Xm—主機(jī)的重組光譜,Xs—子機(jī)的重組光譜;Am—旋轉(zhuǎn)后的主機(jī)因子載荷矩陣;As—旋轉(zhuǎn)后的子機(jī)因子載荷矩陣;Fm—旋轉(zhuǎn)后的主機(jī)因子得分矩陣;Fs—旋轉(zhuǎn)后的子機(jī)因子得分矩陣。
求主機(jī)和子機(jī)間的光譜轉(zhuǎn)移矩陣。由公式(4)通過矩陣變換得到:
將公式(5)帶入公式(6)中,主機(jī)光譜矩陣Xm可以表示為
根據(jù)公式(7)得到轉(zhuǎn)換關(guān)系矩陣P:
由此,利用轉(zhuǎn)換關(guān)系矩陣P 可以得到子機(jī)在主機(jī)上的轉(zhuǎn)換光譜Xtrans:
通過轉(zhuǎn)換光譜Xtrans就可以預(yù)測(cè)在子機(jī)上測(cè)量的光譜轉(zhuǎn)移到主機(jī)上的相應(yīng)光譜。由此在主機(jī)上建立的校正模型就可以用QFST 法通過模型轉(zhuǎn)移應(yīng)用到子機(jī)上。
1.2.4 光譜轉(zhuǎn)移及化學(xué)成分預(yù)測(cè)
以主機(jī)M 掃描的標(biāo)準(zhǔn)樣品光譜為主機(jī)光譜,子機(jī)S1 和子機(jī)S2 掃描的標(biāo)準(zhǔn)樣品光譜為其相應(yīng)的子機(jī)光譜,采用QFST、SST和PDS 3種模型轉(zhuǎn)移方法將子機(jī)光譜校正后,使用主機(jī)模型進(jìn)行各個(gè)化學(xué)指標(biāo)的分析預(yù)測(cè),待得到各模型轉(zhuǎn)移方法相應(yīng)的指標(biāo)預(yù)測(cè)結(jié)果后再統(tǒng)計(jì)分析。
在中國,安道麥推出了多款標(biāo)桿性殺菌劑產(chǎn)品,包括獲得中國植保產(chǎn)品貢獻(xiàn)獎(jiǎng)的“喜思安?”“樂譜道?”“道立鋒?”等一批優(yōu)秀殺菌劑,其中,明星產(chǎn)品“喜思安?”將于2019年全新升級(jí),給果農(nóng)更強(qiáng)的防病美果體驗(yàn)。2017年,“安普博?”作為一款同類進(jìn)口配方產(chǎn)品,以其更強(qiáng)的防病增產(chǎn)表現(xiàn),迅速獲得了不少水稻大戶的青睞?!鞍畛?”的推出補(bǔ)強(qiáng)了真菌、細(xì)菌混發(fā)性病害解決方案。2018年,淮安全球制劑中心為中國供應(yīng)的第一個(gè)產(chǎn)品“靚快?”也表現(xiàn)不俗,先進(jìn)的配方和工藝使得產(chǎn)品品質(zhì)在同類中脫穎而出。第一個(gè)在國內(nèi)登記的進(jìn)口氟啶胺·烯酰嗎啉“寶福特?”將會(huì)在2019年上市,針對(duì)低等真菌病害市場(chǎng),壯大蔬菜產(chǎn)品線。
光譜相似度:計(jì)算同一樣品測(cè)得的兩個(gè)光譜之間的皮爾遜相關(guān)系數(shù),取皮爾遜相關(guān)系數(shù)的平方得到?jīng)Q定系數(shù)(Rs2),最后取所有樣品的決定系數(shù)的平均值評(píng)價(jià)兩個(gè)光譜矩陣的相似度。
其中,在應(yīng)用PDS時(shí)需要調(diào)整窗口的大小,本數(shù)據(jù)集中當(dāng)窗口大小為7時(shí),Rs2最大。
1.2.5 傳遞結(jié)果評(píng)價(jià)
選擇煙草行業(yè)近紅外分析系統(tǒng)的醇化片煙近紅外分析模型作為評(píng)估模型[30],用于本研究中模型轉(zhuǎn)移效果評(píng)價(jià)。對(duì)不同轉(zhuǎn)移方法得到的子機(jī)光譜的預(yù)測(cè)結(jié)果進(jìn)行統(tǒng)計(jì)分析,采用化學(xué)指標(biāo)的校正標(biāo)準(zhǔn)誤差(SEC)和模型決定系數(shù)(R2)作為評(píng)價(jià)指標(biāo)[31],分別對(duì)模型轉(zhuǎn)移效果進(jìn)行分析比較。用SEC評(píng)估預(yù)測(cè)值與檢測(cè)值之間差異的標(biāo)準(zhǔn)偏差,代表模型的整個(gè)殘余誤差。此處的R2是預(yù)測(cè)值與檢測(cè)值皮爾遜相關(guān)系數(shù)的平方,用來評(píng)價(jià)驗(yàn)證集預(yù)測(cè)值與檢測(cè)值之間的相似程度數(shù)。
1.2.6 數(shù)據(jù)處理方法
所有數(shù)據(jù)分析過程通過MATLAB R2022b(美國MathWorks公司)實(shí)現(xiàn)。
將儀器主機(jī)M1和子機(jī)S1、子機(jī)S2上采集的199個(gè)光譜進(jìn)行平均,得到的平均光譜見圖1。可知,相同的煙葉樣本在3臺(tái)儀器上測(cè)量所得的光譜形狀非常相似,但有一定的背景差異,子機(jī)光譜與主機(jī)光譜相比,其整體吸光度產(chǎn)生了不同程度的偏移。其中,子機(jī)S2 光譜相對(duì)于主機(jī)M1 光譜的偏移較大,子機(jī)S1 光譜的偏移較小。為了進(jìn)一步說明儀器間的差異,圖2中給出了主機(jī)和子機(jī)所有光譜主成分分析后的第1和第2主成分的得分圖,其中,第1主成分貢獻(xiàn)率為90.41%,第2主成分貢獻(xiàn)率為8.22%。從圖2中可以看出,子機(jī)S1 的光譜與主機(jī)M1 的光譜存在一定的重疊,而子機(jī)S2與主機(jī)M1的光譜在第1主成分的得分上存在明顯差異,偏移較大。
圖2 3臺(tái)儀器光譜在第1、第2主成分的得分Fig.2 PC1 and PC2 scores of the spectra measured on three instruments
由此可知,使用不同的儀器對(duì)相同樣品進(jìn)行光譜采集時(shí),會(huì)使光譜發(fā)生不同程度的偏移。將主機(jī)的近紅外預(yù)測(cè)模型直接應(yīng)用到子機(jī)上時(shí),會(huì)引起較大的系統(tǒng)預(yù)測(cè)誤差。因此,需要采用合適的模型轉(zhuǎn)移方法提高模型預(yù)測(cè)的準(zhǔn)確性。采用QFST 法對(duì)兩臺(tái)子機(jī)光譜進(jìn)行轉(zhuǎn)移,得到的平均光譜和主成分得分圖如圖3 和圖4 所示。由圖3 可知,經(jīng)QFST 法處理后的子機(jī)S1光譜和子機(jī)S2光譜與原始主機(jī)M1光譜能相對(duì)重合。由圖4可以看出,經(jīng)QFST法處理后的子機(jī)光譜和主機(jī)光譜主成分差異非常小,其中,第1 主成分貢獻(xiàn)率為69.28%,第2 主成分貢獻(xiàn)率為27.35%。采用QFST 法可以大幅消除儀器變化所產(chǎn)生的影響,從而減少子機(jī)S1 和子機(jī)S2 與主機(jī)M1 之間的差異。
圖3 經(jīng)QFST轉(zhuǎn)移后的NIR平均光譜圖Fig.3 NIR mean spectra after QFST transfer
圖4 經(jīng)QFST轉(zhuǎn)移后3臺(tái)儀器光譜在第1、第2主成分的得分Fig.4 PC1 and PC2 scores of the spectra measured on three instruments after QFST transfer
為驗(yàn)證QFST 法在其他型號(hào)近紅外光譜儀上的適用性,選取在Tango Ⅱ型近紅外光譜儀的主機(jī)M2和子機(jī)S3 上采集的245 個(gè)煙葉樣品光譜進(jìn)行驗(yàn)證。主機(jī)M2、子機(jī)S3 和采用QFST 法對(duì)子機(jī)S3 光譜進(jìn)行轉(zhuǎn)移的平均光譜見圖5。可知,相同的煙葉樣本在兩臺(tái)近紅外光譜儀上測(cè)量所得光譜的整體吸光度產(chǎn)生了偏移,經(jīng)QFST 法處理后的子機(jī)S3 光譜與主機(jī)M2光譜基本重合。
圖5 主機(jī)M2和子機(jī)S3轉(zhuǎn)移前、轉(zhuǎn)移后的NIR平均光譜圖Fig.5 NIR mean spectra of the master M2 and slave S3 before and after transfer
主機(jī)M2光譜、子機(jī)S3光譜和采用QFST法對(duì)子機(jī)S3進(jìn)行轉(zhuǎn)移后光譜的第1和第2主成分得分圖見圖6,其中,第1主成分貢獻(xiàn)率為77.06%,第2主成分貢獻(xiàn)率為20.53%??芍D(zhuǎn)移前光譜在第1 主成分的得分上存在明顯差異,經(jīng)QFST法轉(zhuǎn)移后的子機(jī)光譜和主機(jī)光譜主成分差異非常小。因此,QFST法同樣適用于其他型號(hào)的近紅外光譜儀之間的光譜轉(zhuǎn)移,可消除儀器變化所產(chǎn)生的影響。
圖6 主機(jī)M2和子機(jī)S3轉(zhuǎn)移前、轉(zhuǎn)移后的光譜在第1、第2主成分的得分Fig.6 PC1 and PC2 scores of spectra of the master M2 and slave S3 before and after transfer
QFST是基于主成分分析的模型轉(zhuǎn)移方法,即主因子法,因此,所述QFST 的主因子數(shù)也就是主成分?jǐn)?shù)。因QFST 需要采用具有代表性的主因子重構(gòu)光譜矩陣,所以需選擇大于或等于3的主因子數(shù)才能重構(gòu)出數(shù)據(jù)集,并優(yōu)化主成分?jǐn)?shù)對(duì)模型轉(zhuǎn)移的影響。
選定主因子數(shù)從3到50后,采用QFST法將子機(jī)S1 光譜和子機(jī)S2 光譜轉(zhuǎn)移到主機(jī)M1,分別計(jì)算相應(yīng)的決定系數(shù),結(jié)果見圖7a 和7b。可以看出,主成分?jǐn)?shù)越大,采用QFST 法進(jìn)行模型轉(zhuǎn)移的效果越好。當(dāng)主成分?jǐn)?shù)≥4 時(shí),Rs2≥0.999 6,說明子機(jī)光譜經(jīng)模型轉(zhuǎn)移后與主機(jī)光譜一致性好。
圖7 主成分?jǐn)?shù)對(duì)模型轉(zhuǎn)移方法的影響Fig.7 Effects of the number of principal components on model transfer method
QFST法的目標(biāo)是盡可能包含原數(shù)據(jù)的信息量,沒有要求減少因子的數(shù)量。因此,對(duì)于QFST 來說,可以選擇大于5的主成分?jǐn)?shù),在實(shí)際應(yīng)用時(shí)可根據(jù)需求選擇更大的主成分?jǐn)?shù)。
優(yōu)化模型轉(zhuǎn)移方法與標(biāo)準(zhǔn)化樣本的數(shù)量密切相關(guān)。增加標(biāo)準(zhǔn)化樣本的數(shù)量會(huì)提高模型轉(zhuǎn)移的效果,但是模型轉(zhuǎn)移成本也隨著增加。因此,在實(shí)際應(yīng)用中通過優(yōu)化選擇較少的標(biāo)準(zhǔn)化樣本數(shù)量獲得可靠的結(jié)果。由于主因子數(shù)表示代表性樣品的數(shù)量,因此,標(biāo)準(zhǔn)化樣本數(shù)需要大于或等于主因子數(shù)。
主因子數(shù)(f)選定5、10、15 和20 后,在199 個(gè)樣本中選取所需標(biāo)準(zhǔn)化樣本,剩余樣本作為驗(yàn)證集樣本。采用QFST 法將子機(jī)S1 光譜和子機(jī)S2 光譜轉(zhuǎn)移到主機(jī)M1,分別計(jì)算相應(yīng)的決定系數(shù),結(jié)果見圖8??梢钥闯?,隨著標(biāo)準(zhǔn)化樣品數(shù)量的增加,光譜平均相似度逐漸增加,當(dāng)標(biāo)準(zhǔn)化樣品數(shù)量為主因子數(shù)的2.5 倍時(shí),光譜平均相似度增加幅度基本平穩(wěn),但是當(dāng)標(biāo)準(zhǔn)化樣品數(shù)量增加到一定閾值時(shí),再增加標(biāo)準(zhǔn)化樣本數(shù)量對(duì)模型轉(zhuǎn)移效果的影響變小。因此,選擇標(biāo)準(zhǔn)化樣本數(shù)量為選取的主因子數(shù)的2.5 倍或以上,在實(shí)際應(yīng)用中可根據(jù)自己所能承擔(dān)的成本確定合適的標(biāo)準(zhǔn)化樣本數(shù)。
圖8 標(biāo)準(zhǔn)化樣本數(shù)對(duì)QFST結(jié)果的影響Fig.8 Effects of the number of standardization samples on QFST results
在199個(gè)樣本中選取100個(gè)標(biāo)準(zhǔn)化樣本,剩余99個(gè)樣本作為驗(yàn)證集樣本。應(yīng)用建立的QFST 法對(duì)子機(jī)S1和子機(jī)S2的驗(yàn)證集樣本進(jìn)行光譜轉(zhuǎn)移,采用主機(jī)模型預(yù)測(cè)70項(xiàng)化學(xué)指標(biāo),采用預(yù)測(cè)效果最佳的主因子數(shù),其中,S1的主因子數(shù)選取22個(gè),S2的主因子數(shù)選取28 個(gè)。將SEC 和R2作為模型預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo),兩個(gè)子機(jī)光譜在不同模型轉(zhuǎn)移方法下化學(xué)指標(biāo)的R2統(tǒng)計(jì)詳見表1和表2。
表1 子機(jī)S1光譜在不同模型轉(zhuǎn)移方法下化學(xué)指標(biāo)的R2統(tǒng)計(jì)Tab.1 The R2 statistics of chemical indices of the slave S1 spectra by different model transfer methods (個(gè))
表2 子機(jī)S2光譜在不同模型轉(zhuǎn)移方法下化學(xué)指標(biāo)的R2統(tǒng)計(jì)Tab.2 The R2 statistics of chemical indices of the slave S2 spectra by different model transfer methods (個(gè))
從表1和表2可以看出,子機(jī)S1和S2應(yīng)用QFST法進(jìn)行模型轉(zhuǎn)移后的預(yù)測(cè)結(jié)果整體優(yōu)于直接應(yīng)用主機(jī)模型對(duì)子機(jī)光譜進(jìn)行預(yù)測(cè)的結(jié)果,QFST法和SST法的整體預(yù)測(cè)效果優(yōu)于PDS 法,其中,QFST 法預(yù)測(cè)結(jié)果R2≥0.9的化學(xué)指標(biāo)最多。對(duì)于總植物堿、還原糖、總糖、總氮和氯等常規(guī)化學(xué)成分,3種模型轉(zhuǎn)移方法的預(yù)測(cè)結(jié)果R2均大于或等于0.9。與直接預(yù)測(cè)相比采用QFST法轉(zhuǎn)移后預(yù)測(cè),亞油酸、亮氨酸、酪氨酸和色氨酸等指標(biāo)的R2從小于0.8提升到大于等于0.8但小于0.9 的范圍;總植物堿、鉀、氯、淀粉和二氯甲烷提取物等指標(biāo)的R2從大于等于0.8但小于0.9提升到≥0.9;在R2≥0.9的指標(biāo)里,淀粉、二氯甲烷提取物和鈣離子等指標(biāo)采用QFST 法后的預(yù)測(cè)結(jié)果更接近測(cè)量的結(jié)果。
由于預(yù)測(cè)結(jié)果R2≥0.9 已經(jīng)達(dá)到很高的預(yù)測(cè)標(biāo)準(zhǔn),因此,以子機(jī)S2 為例,選取QFST 方法預(yù)測(cè)結(jié)果R2<0.9的55個(gè)指標(biāo),對(duì)比分析QFST法與SST法的結(jié)果,即將QFST法得到的化學(xué)指標(biāo)SEC比值和R2比值與SST法進(jìn)行比較,結(jié)果見圖9。SEC為化學(xué)指標(biāo)的校正標(biāo)準(zhǔn)誤差,因此,SEC 值越小越好,而R2值越大越好。由圖9a可知,對(duì)于多酚類化合物的預(yù)測(cè),采用QFST法與SST法轉(zhuǎn)移后預(yù)測(cè)效果相近;對(duì)于有機(jī)酸的預(yù)測(cè),從整體上看,采用QFST 法轉(zhuǎn)移后預(yù)測(cè)的效果略優(yōu)于SST 法;磷酸根與硫酸根的R2比值大于1,采用QFST 法略優(yōu)于SST 法。由圖9b 和9c 可以看出,對(duì)于氨基酸和Amadori 化合物等煙草中質(zhì)量分?jǐn)?shù)較低的化學(xué)成分來說,62%的氨基酸的R2比值大于1,采用QFST 法轉(zhuǎn)移后預(yù)測(cè)的效果略優(yōu)于SST法;88%的Amadori 化合物的R2比值大于1,采用QFST法轉(zhuǎn)移后預(yù)測(cè)的效果優(yōu)于SST法。
圖9 部分化學(xué)指標(biāo)采用QFST法和SST法的SEC和R2的比較Fig.9 Results of SEC and R2 by QFST and SST methods for some chemical components
(1)建立了QFST 模型轉(zhuǎn)移方法,并將其應(yīng)用于煙草近紅外預(yù)測(cè)的模型轉(zhuǎn)移中,可以有效解決子機(jī)與主機(jī)間的儀器差異所帶來的光譜影響。
(2)對(duì)QFST 法優(yōu)化的結(jié)果表明,選取的主成分?jǐn)?shù)越大,模型轉(zhuǎn)移的效果越好。在實(shí)際應(yīng)用中可以選擇大于4甚至更大的主成分?jǐn)?shù),標(biāo)準(zhǔn)化樣本數(shù)則應(yīng)為選取的主成分?jǐn)?shù)的2.5倍或以上。
(3)將建立的QFST模型轉(zhuǎn)移法與SST和PDS模型轉(zhuǎn)移法進(jìn)行比較,對(duì)于煙草70 種化學(xué)指標(biāo),QFST法和SST法的模型預(yù)測(cè)效果整體上優(yōu)于PDS法。應(yīng)用QFST、SST 和PDS 3 種模型轉(zhuǎn)移方法后進(jìn)行預(yù)測(cè),其中,總植物堿、還原糖、總糖、總氮和氯等常規(guī)化學(xué)成分的R2均達(dá)到0.9 以上。尤其是對(duì)于氨基酸和Amadori 化合物等煙草中質(zhì)量分?jǐn)?shù)較低的化學(xué)成分來說,采用QFST法進(jìn)行模型轉(zhuǎn)移后預(yù)測(cè)的效果優(yōu)于SST法。