楊光遠(yuǎn),韓 磊,鄧少鵬,劉 強(qiáng),王 聞
(湖北中煙卷煙材料廠,湖北 武漢 430051)
三醋酸甘油酯是卷煙濾棒成型加工工藝過(guò)程中的增塑劑、固化劑,其含量是濾棒質(zhì)量控制的一個(gè)重要指標(biāo),對(duì)卷煙濾棒的物理指標(biāo)和煙氣的感官質(zhì)量起著至關(guān)重要的作用。三醋酸甘油酯含量過(guò)低,則濾棒的硬度不夠,直接影響濾棒品質(zhì);其含量過(guò)高,過(guò)多的三醋酸甘油酯將轉(zhuǎn)移到煙氣中,從而影響卷煙煙氣的感官質(zhì)量[1]。因此,快速、準(zhǔn)確檢測(cè)濾棒中的三醋酸甘油酯含量,對(duì)濾棒成型工藝的質(zhì)量控制具有重要的實(shí)際意義和推廣應(yīng)用價(jià)值。
在工業(yè)生產(chǎn)中,濾棒中三醋酸甘油酯含量的測(cè)定方法主要有以下4種:重量法、皂化滴定法、氣相色譜法和近紅外光譜法[2]。重量法操作簡(jiǎn)易,適用于濾棒生產(chǎn)車(chē)間的現(xiàn)場(chǎng)快速測(cè)定,但其精確度無(wú)法得到保障;煙草行業(yè)標(biāo)準(zhǔn)YC/T144-1998[3]使用皂化滴定法測(cè)定濾棒中的三醋酸甘油酯純度,但操作復(fù)雜、耗時(shí),需要專(zhuān)業(yè)的技術(shù)人員,無(wú)法進(jìn)行濾棒生產(chǎn)車(chē)間的現(xiàn)場(chǎng)快速檢測(cè);氣相色譜法是煙草行業(yè)標(biāo)準(zhǔn)YC/T331-2010[4]規(guī)定的另一種檢測(cè)方法,其檢測(cè)精確度高,但單個(gè)樣本檢測(cè)價(jià)格較高,且操作費(fèi)時(shí)費(fèi)力,難以用于生產(chǎn)車(chē)間現(xiàn)場(chǎng)測(cè)定。專(zhuān)利CN101334387A[5]和專(zhuān)利CN110174417A[6]使用近紅外光譜技術(shù)檢測(cè)濾棒中的三醋酸甘油酯含量,但均使用臺(tái)式近紅外光譜設(shè)備,測(cè)定時(shí)需要大量的濾棒樣本或?qū)V棒外層的成型紙剝除,并需將濾棒進(jìn)行粉粹,操作過(guò)程繁瑣費(fèi)時(shí)、投入大。因此,尋求一種能夠?qū)崿F(xiàn)生產(chǎn)車(chē)間濾棒中三醋酸甘油酯含量現(xiàn)場(chǎng)快速、準(zhǔn)確、批量測(cè)量的有效方法,具有重要實(shí)際意義和推廣應(yīng)用價(jià)值。
同時(shí),在建模方法上,以上兩個(gè)專(zhuān)利所使用的三醋酸甘油酯近紅外光譜定量建模方法均為偏最小二乘法(Partial least squares,PLS),該法存在受異常值擾動(dòng)影響大的缺陷。在工業(yè)生產(chǎn)時(shí),工業(yè)數(shù)據(jù)一般含有測(cè)量誤差,當(dāng)以誤差數(shù)據(jù)作為自變量進(jìn)行偏最小二乘回歸時(shí),得到的參數(shù)估計(jì)值不能正確反映數(shù)據(jù)變量之間的結(jié)構(gòu)關(guān)系[7]。與偏最小二乘法不同,極限學(xué)習(xí)機(jī)(Extreme learning machine,ELM)作為一種基于前饋神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法,學(xué)習(xí)過(guò)程僅需計(jì)算輸出權(quán)重,具有學(xué)習(xí)效率高、泛化能力強(qiáng)的優(yōu)點(diǎn),能夠解決反向傳播算法學(xué)習(xí)效率低、參數(shù)設(shè)定繁瑣的問(wèn)題[8]。但ELM 算法也存在一定的缺陷,如算法的隱含神經(jīng)元個(gè)數(shù)一般由計(jì)算機(jī)隨機(jī)設(shè)定,從而導(dǎo)致算法的穩(wěn)定性不高。粒子群優(yōu)化(Particle swarm optimization,PSO)算法與極限學(xué)習(xí)機(jī)算法相結(jié)合,能夠解決ELM 算法隱含神經(jīng)元個(gè)數(shù)隨機(jī)設(shè)置帶來(lái)的網(wǎng)絡(luò)冗余問(wèn)題,增強(qiáng)ELM 算法的泛化能力,在一定程度上完善ELM算法的性能。研究表明經(jīng)PSO 優(yōu)化后的ELM 神經(jīng)網(wǎng)絡(luò)光譜模型預(yù)測(cè)結(jié)果的準(zhǔn)確性優(yōu)于原有的ELM 神經(jīng)網(wǎng)絡(luò)[9-11]。為此,本文擬通過(guò)使用PSO 算法對(duì)ELM 的隱含神經(jīng)元個(gè)數(shù)進(jìn)行優(yōu)化,以尋求最優(yōu)的隱含神經(jīng)元個(gè)數(shù),建立最佳的近紅外光譜回歸預(yù)測(cè)模型。
本文基于手持近紅外光譜分析技術(shù)和ELM 算法,并聯(lián)合PSO 算法實(shí)現(xiàn)了對(duì)卷煙濾棒中三醋酸甘油酯含量的近紅外光譜快速定量建模,并將所建模型應(yīng)用于生產(chǎn)車(chē)間現(xiàn)場(chǎng)快速測(cè)量濾棒中三醋酸甘油酯的含量。本方法無(wú)需破壞濾棒樣品,操作更簡(jiǎn)便,省時(shí)省力,便于實(shí)際生產(chǎn)操作,適用于生產(chǎn)車(chē)間大批量樣品的測(cè)定分析,為實(shí)時(shí)監(jiān)控生產(chǎn)過(guò)程中濾棒中三醋酸甘油酯含量奠定了技術(shù)基礎(chǔ)。
與傳統(tǒng)的機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法相比,ELM 具有以下優(yōu)勢(shì):(1)計(jì)算速度快,隱含層的神經(jīng)元數(shù)隨機(jī)設(shè)定,訓(xùn)練過(guò)程不需要迭代調(diào)整;(2)不會(huì)陷入局部最優(yōu),因?yàn)镋LM 算法求解輸出權(quán)值偏最小二乘解的過(guò)程是一個(gè)凸優(yōu)化問(wèn)題;(3)參數(shù)設(shè)定簡(jiǎn)單,無(wú)過(guò)多的復(fù)雜參數(shù)設(shè)定,而傳統(tǒng)的機(jī)器學(xué)習(xí)算法如反向傳播(BP)網(wǎng)絡(luò)等,在學(xué)習(xí)過(guò)程中需要選擇合適的學(xué)習(xí)率、訓(xùn)練步長(zhǎng)等,參數(shù)選擇不當(dāng)將影響網(wǎng)絡(luò)的泛化性,算法的詳細(xì)流程見(jiàn)文獻(xiàn)[12]。
PSO算法的基本思想是模擬鳥(niǎo)群隨機(jī)搜尋食物的捕食行為,鳥(niǎo)群通過(guò)自身經(jīng)驗(yàn)和種群之間的交流調(diào)整自己的搜尋路徑,從而找到食物最多的地點(diǎn)。其中每只鳥(niǎo)的位置和路徑為自變量組合,每次到達(dá)的地點(diǎn)的食物密度即函數(shù)值。每次搜尋都會(huì)根據(jù)自身經(jīng)驗(yàn)(自身歷史搜尋的最優(yōu)地點(diǎn))和種群交流(種群歷史搜尋的最優(yōu)地點(diǎn))調(diào)整自身搜尋方向和速度(稱為跟蹤極值),從而找到最優(yōu)解[13]。算法的步驟如下:
步驟一:假設(shè)有一個(gè)運(yùn)動(dòng)粒子,對(duì)粒子的位置和速度兩個(gè)參數(shù)進(jìn)行初始化;步驟二:設(shè)定每次搜尋的結(jié)果為粒子適應(yīng)度,分別記錄粒子的個(gè)體和群體歷史最優(yōu)位置;步驟三:分別將個(gè)體和群體的歷史最優(yōu)位置看作兩個(gè)力,并結(jié)合粒子本身的慣性,綜合考慮以上因素如何影響粒子的運(yùn)動(dòng)狀態(tài),從而更新粒子的位置和速度。
使用近紅外光譜技術(shù)和PSO-ELM 算法實(shí)現(xiàn)對(duì)濾棒中三醋酸甘油酯含量快速檢測(cè)的流程主要包括以下5個(gè)步驟:(1)樣本近紅外光譜的采集;(2)光譜預(yù)處理和波長(zhǎng)的選擇;(3)PSO-ELM 算法的參數(shù)設(shè)置;(4)建立PSO-ELM回歸預(yù)測(cè)模型;(5)實(shí)現(xiàn)測(cè)試樣本的快速預(yù)測(cè)。
實(shí)驗(yàn)所使用的光譜儀為江蘇揚(yáng)光綠能股份有限公司所生產(chǎn)的G1 手持式DLP-NIR 近紅外光譜儀。在光譜分析中,DLP 微鏡陣列作為一個(gè)可編程波長(zhǎng)選擇濾波器,相比于傳統(tǒng)的銦鎵砷傳感器,其光譜儀架構(gòu)更加簡(jiǎn)便,成本大大降低[14]。手持近紅外光譜儀的波長(zhǎng)范圍為900~1 700 nm,光譜分辨率為5.85 nm,掃描點(diǎn)數(shù)為225。
實(shí)驗(yàn)樣本由湖北中煙卷煙材料廠于2021 年提供,共98 個(gè)樣本。在實(shí)驗(yàn)過(guò)程中,選取70 個(gè)樣本作為訓(xùn)練樣本,28 個(gè)樣本作為測(cè)試樣本。使用煙草行業(yè)標(biāo)準(zhǔn)YC/T331-2010《醋酸纖維濾棒中三醋酸甘油酯的測(cè)定-氣相色譜法》中的測(cè)定方法進(jìn)行測(cè)定,得到訓(xùn)練樣本的三醋酸甘油酯含量范圍為1%~15%,平均值為7.28%,標(biāo)準(zhǔn)差為1.99;測(cè)試樣本的三醋酸甘油酯含量范圍為5%~10%,平均值為7.35%,標(biāo)準(zhǔn)差為1.16。實(shí)驗(yàn)樣本的詳細(xì)信息如表1所示。
表1 實(shí)驗(yàn)樣本的詳細(xì)信息Table 1 The detail of experimental samples
光譜的采集模式為反射模型,將濾棒樣本豎直放置于光譜儀的光源上,每個(gè)樣本掃描6 次,取6 次光譜的平均值作為最終光譜。實(shí)驗(yàn)樣本的原始近紅外光譜數(shù)據(jù)如圖1所示。
光譜數(shù)據(jù)的處理步驟如下:(1)對(duì)采集的濾棒的近紅外光譜數(shù)據(jù)進(jìn)行不同的預(yù)處理,選取最優(yōu)的預(yù)處理方法;(2)選擇合適的建模波段;(3)分別采用偏最小二乘回歸(PLSR)[15]、極限學(xué)習(xí)機(jī)回歸(ELMR)和粒子群優(yōu)化-極限學(xué)習(xí)機(jī)回歸(PSO-ELMR)建立濾棒近紅外光譜數(shù)據(jù)與三醋酸甘油酯含量之間的回歸預(yù)測(cè)模型。
建立回歸預(yù)測(cè)模型后,分別使用決定系數(shù)(R2)、校正均方根誤差(RMSEC)、預(yù)測(cè)均方根誤差(RMSEP)為模型評(píng)價(jià)指標(biāo),指標(biāo)的具體計(jì)算方法如下[16]:
RSS 和SS分別表示最終模型預(yù)測(cè)數(shù)據(jù)的殘差平方和響應(yīng)變量方差,yi為第i個(gè)樣本的真實(shí)值,yic為訓(xùn)練集第i個(gè)樣本的預(yù)測(cè)值,yip為測(cè)試集第i個(gè)樣本的預(yù)測(cè)值,n為訓(xùn)練集的樣本數(shù),m為測(cè)試集的樣本數(shù)。
為降低噪聲及其它因素對(duì)光譜質(zhì)量的影響,提高回歸預(yù)測(cè)模型精度,對(duì)采集的近紅外光譜數(shù)據(jù)進(jìn)行不同的預(yù)處理操作,包括多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(SNV)及平滑處理(Savitzky-Golay),以確定最優(yōu)建模波段[17-18]。表2 為不同預(yù)處理方法下使用PLS 建立的預(yù)測(cè)模型的結(jié)果比較。R2越大,RMSEP和RMSEC越小,模型預(yù)測(cè)效果越好。由表可知,基于Savitzky-Golay的預(yù)處理方法所建立的回歸預(yù)測(cè)模型具有最佳的預(yù)測(cè)效果,其參數(shù)設(shè)置為窗口大小13、2次多項(xiàng)式。同時(shí),從圖2可以看出,光譜吸收的波長(zhǎng)區(qū)間主要集中在1 050~1 200 nm和1 300~1 500 nm。因此,后續(xù)主要使用Savitzky-Golay預(yù)處理方法及這兩個(gè)波長(zhǎng)區(qū)間對(duì)濾棒樣本的近紅外光譜數(shù)據(jù)和三醋酸甘油酯含量進(jìn)行定量建模。
圖2 原始光譜經(jīng)Savitzky-Golay(窗口大小為13,2次多項(xiàng)式)處理后的結(jié)果Fig.2 Pretreatment results of spectral data by Savitzky-Golay first derivative with a 13-point window and 2 polynomial order
表2 基于PLS建立的不同預(yù)處理方法的卷煙濾棒三醋酸甘油酯含量的預(yù)測(cè)模型性能比較結(jié)果Table 2 Calibration and validation results for spectral models of glycerol triacetate content of cigarette filter based on PLS algorithm with different pretreatment methods
分別使用PLSR、ELMR 和PSO-ELMR 建立近紅外光譜數(shù)據(jù)和煙草行業(yè)標(biāo)準(zhǔn)測(cè)量方法所獲得的三醋酸甘油酯含量之間的定量預(yù)測(cè)模型。在使用ELM 算法建立回歸預(yù)測(cè)模型時(shí),隱含層神經(jīng)元個(gè)數(shù)是最為重要的一個(gè)參數(shù),傳統(tǒng)方法由計(jì)算機(jī)進(jìn)行隨機(jī)設(shè)置,導(dǎo)致算法的穩(wěn)定性無(wú)法得到保證。為了解決該問(wèn)題,本文使用PSO 算法對(duì)ELM 算法的隱含層神經(jīng)元個(gè)數(shù)進(jìn)行優(yōu)化,結(jié)果如圖3 所示。由圖3 可以看出,模型的RMSEC 和RMSEP 指標(biāo)隨著ELM 算法隱含層神經(jīng)元個(gè)數(shù)的增加逐漸減小并趨向穩(wěn)定。根據(jù)圖3 結(jié)果確定ELM算法最佳隱含層神經(jīng)元的個(gè)數(shù)為55。
圖3 PSO算法優(yōu)化ELM回歸模型最佳隱含神經(jīng)元過(guò)程Fig.3 Process of the best hidden neuron of ELM regression model optimized by PSO algorithm
使用R2、RMSEC、RMSEP 為指標(biāo)優(yōu)化建模參數(shù),建模結(jié)果和預(yù)測(cè)結(jié)果分別如表3、表4 所示。ELM 回歸模型以Sigmoidal函數(shù)為隱含層神經(jīng)元激勵(lì)函數(shù),隱含層神經(jīng)元數(shù)、輸入權(quán)重Wi和隱層的偏置bi在訓(xùn)練過(guò)程中隨機(jī)確定;而PSO-ELM 回歸模型的隱含層神經(jīng)元激勵(lì)函數(shù)也使用Sigmoidal函數(shù),隱含層神經(jīng)元個(gè)數(shù)由PSO算法優(yōu)化后確定為55。
由表3可以看出,使用PSO-ELMR算法所建立訓(xùn)練集模型的決定系數(shù)R2為0.921 2,高于PLSR 和ELMR算法;同時(shí),使用PSO-ELMR算法所建立的回歸預(yù)測(cè)模型的訓(xùn)練集均方根誤差為0.369 43,低于PLS和ELMR算法。從表4的結(jié)果可以看出,在預(yù)測(cè)方面,PSO-ELMR算法預(yù)測(cè)模型的決定系數(shù)為0.916 2,高于PLSR 和ELMR 算法;同時(shí),使用ELM 算法的預(yù)測(cè)集均方根誤差為0.392 12,低于PLSR 和ELMR 算法。因此,ELMR 經(jīng)PSO 算法進(jìn)行參數(shù)優(yōu)化后,在建模效果和預(yù)測(cè)結(jié)果方面,均取得了最高的決定系數(shù)和最小的均方根誤差。即相對(duì)于傳統(tǒng)的PLSR 和ELMR 方法,PSO-ELMR 提高了訓(xùn)練集的數(shù)據(jù)利用率,具有更好的泛化性能和更高的回歸預(yù)測(cè)精度。表5給出了使用PSO-ELMR算法和臺(tái)式近紅外光譜數(shù)據(jù)的建模和預(yù)測(cè)結(jié)果,其中臺(tái)式近紅外光譜的采集參數(shù)為:光譜掃描范圍4 000~10 000 cm-1(1 000~2 500 nm),掃描次數(shù)32,分辨率4 cm-1。由表4、表5的對(duì)比結(jié)果看出,使用臺(tái)式近紅外光譜數(shù)據(jù)的建模和預(yù)測(cè)結(jié)果略優(yōu)于使用手持式近紅外光譜數(shù)據(jù)。但手持式近紅外光譜設(shè)備的成本遠(yuǎn)低于臺(tái)式近紅外光譜設(shè)備,且攜帶方便、操作靈活,在光譜采集時(shí)不需要對(duì)濾棒樣本進(jìn)行前處理操作,便于實(shí)際生產(chǎn)和生產(chǎn)車(chē)間大批量樣品的現(xiàn)場(chǎng)測(cè)定分析,具有更高的實(shí)際應(yīng)用價(jià)值。
表3 不同建模方法的訓(xùn)練結(jié)果Table 3 The training results using different modeling methods
表4 不同建模方法測(cè)試樣本的預(yù)測(cè)結(jié)果Table 4 The prediction results of testing samples using different modeling methods
表5 使用PSO-ELMR算法的臺(tái)式近紅外光譜儀器的建模結(jié)果Table 5 The modeling results using PSO-ELMR algorithm of desktop NIR spectroscopy instrument
本文通過(guò)使用手持式近紅外光譜儀,結(jié)合PSO-ELM算法建立了濾棒三醋酸甘油酯的手持近紅外光譜回歸預(yù)測(cè)模型,實(shí)現(xiàn)了濾棒中三醋酸甘油酯的現(xiàn)場(chǎng)快速檢測(cè)。與現(xiàn)有方法相比,本方法具有快速準(zhǔn)確、綠色無(wú)損等優(yōu)點(diǎn),為濾棒三醋酸甘油酯含量的實(shí)時(shí)在線監(jiān)測(cè)和其它質(zhì)量參數(shù)的快速測(cè)量奠定了技術(shù)基礎(chǔ)。