王成虎 周錦龍* 縱 坤 岳 偉 鄧 飛
(1.安徽中煙工業(yè)有限責(zé)任公司,蚌埠 233000; 2.無錫市南木測控技術(shù)有限公司,無錫 214100)
煙支相對濕度(即含水率)和密度是衡量煙草品質(zhì)的一個重要指標(biāo)。前者對其品質(zhì)的影響具體表現(xiàn)在:相對濕度過高,在煙草運(yùn)輸、儲藏過程中易發(fā)霉;而相對濕度過低,其燃燒速度加快,導(dǎo)致煙味調(diào)和不充分,刺激性增強(qiáng),嚴(yán)重影響吸食品質(zhì)。煙支密度描述的是煙支中煙絲填充度,根據(jù)不同的填充度,其重量、硬度、吸阻、端部落絲量等物理指標(biāo)均會有較大的差異,同時,密度分布不均對其燃燒均勻度和速度也會有較大的影響,在雪茄煙的品質(zhì)評價(jià)中尤為重要[1-3]。
雪茄煙是一種特殊的煙草制品。不同于普通卷煙,雪茄煙是由具有一定濕度的煙葉(即茄衣)包卷片狀煙芯制成,其相對濕度與密度較普通卷煙偏高,且與其質(zhì)量的相關(guān)性更大[4,5]。若茄衣與煙芯的相對濕度相差較大或分布不一,其內(nèi)外燃燒速度會有較大差異,導(dǎo)致吸食過程中出現(xiàn)茄衣或煙芯率先燃燒完的情況,嚴(yán)重影響吸食品質(zhì)。另外,由于雪茄煙較普通卷煙具有更大的直徑和長度,若其橫截面密度分布不均,在吸食過程中會出現(xiàn)以某一直徑為軸的左右兩端煙芯燃燒速度不同,影響吸食品質(zhì)。
目前,雪茄煙相對濕度與密度檢測方法主要參考普通卷煙相對濕度和密度檢測方法,即烘干法與儀器測量法。其中,儀器測量法中主流方法是微波檢測法,其原理是不同相對濕度和密度的煙支介電常數(shù)存在一定差異,進(jìn)而引起微波諧振腔中諧振頻率和振幅發(fā)生變化,將這種變化與其相對濕度和密度一一對應(yīng),建立某種數(shù)學(xué)關(guān)系(即模型),實(shí)現(xiàn)煙支相對濕度和密度的快速無損檢測[6-10]。查閱大量的文獻(xiàn)發(fā)現(xiàn),當(dāng)前微波檢測中常用諧振腔的頻率偏移和帶寬變化作為樣品特征信息進(jìn)行數(shù)據(jù)分析,采用線性回歸方法建模,后期模型轉(zhuǎn)移和維護(hù)存在一定的局限性和不穩(wěn)定性。本研究將微波檢測技術(shù)與化學(xué)計(jì)量學(xué)方法相結(jié)合進(jìn)行數(shù)據(jù)分析與模型研究,旨在提高傳統(tǒng)建模方法的穩(wěn)定性和預(yù)測精度。
試驗(yàn)所用雪茄煙樣品由安徽中煙工業(yè)有限責(zé)任公司提供,共90個樣品,雪茄煙樣品規(guī)格:煙條長120±0.5mm,直徑12±0.5mm。
MW100微波水分密度儀(無錫市南木測控科技有限公司);BSM-120.4型電子天平(上海市卓精電子科技有限公司,±0.0001g);DHS-16型電子水分測定儀(寧波市鄞州華豐電子儀器廠,±0.005g);SPX-50B生化培養(yǎng)箱(鄭州市安晟科學(xué)儀器有限公司);T1-108B型電烤箱(廣東美的廚房電器制造有限公司)。
1.3.1 樣品制備
前期對雪茄煙樣進(jìn)行預(yù)實(shí)驗(yàn),根據(jù)其相對濕度范圍(7.0 ~ 14.0%),確定了煙樣調(diào)濕條件,如表1所示。試驗(yàn)樣品具體制備方法:①將待測煙樣分組編號;②置于電烤箱(105±1℃)烘烤2h;③冷卻至室溫后,放入生化培養(yǎng)箱(T:25±2℃,W:99.99%)進(jìn)行調(diào)濕處理;④調(diào)濕結(jié)束后,按照表1的組號將煙樣置于不同的密封袋中,統(tǒng)一放入冰箱(4℃)冷藏16 ~ 24h。
表1 雪茄煙樣調(diào)濕條件
1.3.2 樣品采集
在環(huán)境溫度為25℃的條件下,MW100微波水分密度儀進(jìn)行校準(zhǔn)后,將雪茄煙樣按照編號依次裝入樣品臺,進(jìn)行微波數(shù)據(jù)采集,并對樣品進(jìn)行稱重(此時為含有一定水分煙樣),記作mw。待樣品數(shù)據(jù)全部采集完成后,將其置于電烤箱中(105±1℃)烘烤2h,冷卻后再次對其進(jìn)行微波數(shù)據(jù)采集、稱重(此時為不含水分煙樣),記作md。試樣相對濕度、密度值分別按照式(1)、(2)計(jì)算。
其中,M是相對濕度,V是煙樣體積。
1.3.3 數(shù)學(xué)建模與評價(jià)分析
雪茄煙樣微波數(shù)據(jù)處理在NMAnalysis數(shù)據(jù)處理軟件(V2.0.1)上完成,根據(jù)不同的建模方法對其原始數(shù)據(jù)進(jìn)行相應(yīng)的預(yù)處理;采用Sample set partitioning based on joint x-y distance(SPXY)方法按照7:3的比例劃分樣品校正集和預(yù)測集。煙樣相對濕度分別采用一元線性回歸、二階多項(xiàng)式回歸、兩點(diǎn)分段線性回歸以及偏最小二乘回歸法(PLSR)建模;密度分別采用多元線性回歸、PLSR建模。
為合理評價(jià)所建立的模型,本研究采用內(nèi)部交互驗(yàn)證和外部驗(yàn)證相結(jié)合的方式進(jìn)行評價(jià),由校正相關(guān)系數(shù)(Rc)、預(yù)測相關(guān)系數(shù)(Rp)、校正均方差(RMSEC)和預(yù)測均方差(RMSEP)進(jìn)行評價(jià),當(dāng)RMSEP與RMSEC的比值在0.8 ~ 1.2之間,所建立的模型預(yù)測效果較好。
微波法檢測濕度、密度是基于介電常數(shù)和介質(zhì)損耗進(jìn)行的,直觀表現(xiàn)在不同介電常數(shù)和介質(zhì)損耗會對諧振腔固有空腔幅頻曲線中心頻點(diǎn)和帶寬產(chǎn)生影響。圖1所示為含雪茄煙樣的幅頻曲線與空腔幅頻曲線。由圖可知,當(dāng)雪茄煙樣通過微波諧振腔時,其固有中心頻點(diǎn)f0偏移到fs,帶寬由w0變?yōu)閣s,前人研究常用這兩個變量信息來表征樣品的相對濕度和密度,采用線性回歸方法建立模型[11,12]。但樣品在微波掃頻過程中會對整個幅頻曲線產(chǎn)生影響,即每個頻點(diǎn)都會有偏移和幅值變化,僅使用中心頻點(diǎn)的相關(guān)信息來表征,在數(shù)據(jù)分析方面存在片面性和敏感性,容易造成模型不穩(wěn)定和預(yù)測精度較差。
圖1 雪茄煙微波原始數(shù)據(jù)
化學(xué)計(jì)量學(xué)是一門化學(xué)與數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)交叉產(chǎn)生的新興化學(xué)學(xué)科分支,它利用數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)技術(shù)的原理和方法來處理化學(xué)數(shù)據(jù),通過對測量數(shù)據(jù)進(jìn)行處理分析,最大限度獲取其化學(xué)成分指標(biāo)[13]?;瘜W(xué)計(jì)量學(xué)方法常用在近紅外光譜分析技術(shù)中,通過對其數(shù)據(jù)進(jìn)行光譜預(yù)處理,經(jīng)主成分分析(PCA)提取特征信息后,采用PLSR建模。由于近紅外與微波均屬于電磁波,且傳統(tǒng)近紅外光譜量測是在頻域進(jìn)行的,而微波單次量測也是在頻域進(jìn)行的,因此本研究提出,采用化學(xué)計(jì)量學(xué)相關(guān)方法對微波量測數(shù)據(jù)進(jìn)行分析,對微波全頻點(diǎn)進(jìn)行數(shù)據(jù)特征提取,進(jìn)而建立煙支相對濕度、密度數(shù)學(xué)模型。
2.2.1 雪茄煙傳統(tǒng)線性模型計(jì)算原理
目前,采用微波檢測技術(shù)進(jìn)行相對濕度、密度量測均基于微波諧振頻率偏移和帶寬變化,相關(guān)的數(shù)學(xué)表達(dá)式如式(3)、式(4):
2.2.2 雪茄煙微波數(shù)據(jù)預(yù)處理
根據(jù)微波檢測技術(shù)原理,在量測數(shù)據(jù)的預(yù)處理中,為減小測量過程中設(shè)備波動帶來的測量數(shù)據(jù)波動,需要對其進(jìn)行空白背景扣除,這里選擇空腔幅頻曲線作為空白背景,則實(shí)際樣品數(shù)據(jù)SD可根據(jù)式(5)計(jì)算,其中,ScanData是樣品掃頻數(shù)據(jù),ReferenceData是空腔掃頻數(shù)據(jù)。
圖2為微波數(shù)據(jù)預(yù)處理后的結(jié)果,由圖可知,在微波響應(yīng)頻段,不同相對濕度的雪茄煙樣微波數(shù)據(jù)具有形狀相似但不重合的特點(diǎn),表明該預(yù)處理方法可以反映出其中相對濕度的差異。
圖2 雪茄煙微波數(shù)據(jù)
2.2.3 主成分分析
研究采用主成分分析法(PCA)對微波數(shù)據(jù)進(jìn)行降維分解,通過交互驗(yàn)證(Cross Validation)確定最佳主成分個數(shù),利用預(yù)測殘差平方和(Prediction Residual Error Sum of Square,PRESS)作為判據(jù)。具體計(jì)算過程:進(jìn)行交互驗(yàn)證時,從校正集樣品中取出一定數(shù)量的樣品作為預(yù)測集樣品,其余樣品建立校正模型預(yù)測前面的預(yù)測集樣品。經(jīng)多次建模預(yù)測,直到所有樣本均被預(yù)測一次且只被預(yù)測一次,得到對應(yīng)的主因子數(shù)的PRESS值。PRESS值越小,表明模型預(yù)測能力越好[14]。
圖3所示為雪茄煙樣相對濕度交互驗(yàn)證PRESS圖,由圖可知,當(dāng)主成分個數(shù)為3時,PRESS明顯減小,一般認(rèn)為,PRESS隨主成分個數(shù)增加呈遞減趨勢,當(dāng)PRESS達(dá)到最小值時,增加主成分個數(shù),開始出現(xiàn)微小上升或波動,說明此后加入的主成分為噪聲成分。圖4顯示了相對濕度的主成分得分,前3個主成分累計(jì)得分97.8822%,結(jié)合圖3可得,雪茄煙樣相對濕度最佳主成分個數(shù)為3。同理,雪茄煙樣密度最佳主成分個數(shù)為6。
圖3 雪茄煙樣相對濕度交互驗(yàn)證PRESS圖
圖4 雪茄煙樣主成分得分圖
2.2.4 模型建立及評價(jià)
(1)樣品劃分
采用SPXY方法按照 7:3 的比例劃分校正集和預(yù)測集。表2為采用傳統(tǒng)線性回歸方法劃分的雪茄煙樣相對濕度、密度樣品信息。由表可知,校正集水分范圍在3.51% ~ 17.51%,包含了預(yù)測集樣品水分分布范圍(3.51% ~ 17.00%),表明樣品劃分合理。但校正集和預(yù)測集的樣品標(biāo)準(zhǔn)偏差均較大,表明樣品離散度較大,可通過后續(xù)補(bǔ)充試驗(yàn)進(jìn)行樣本補(bǔ)充。同理,校正集密度范圍包含了預(yù)測集密度范圍,且校正集和預(yù)測集密度標(biāo)準(zhǔn)偏差均較小,樣品分布較為合理。
表2 雪茄煙樣劃分樣品信息
(2)雪茄煙相對濕度校正模型建立及評價(jià)
基于上述預(yù)處理方法和最佳主成分?jǐn)?shù),對雪茄相對濕度樣品數(shù)據(jù)采用SPXY方法按照7:3的比例劃分樣品校正集和預(yù)測集,分別用一元線性回歸、二階多項(xiàng)式回歸、兩點(diǎn)分段線性回歸以及偏最小二乘回歸等4種方法進(jìn)行建模分析,得到如圖 5 所示的各方法模型交叉驗(yàn)證圖。由圖可知,采用一元線性回歸得到的模型結(jié)果與后面 3 種建模方法得到的模型相比,效果較差;而兩點(diǎn)分段線性回歸結(jié)果與PLSR模型結(jié)果一致,但分段線性回歸易受校正集數(shù)據(jù)的影響,導(dǎo)致模型不穩(wěn)定,此處不推薦使用;PLSR模型與二階多項(xiàng)式模型相比,有較高的Rc和較小的RMSEC,且其預(yù)測絕對偏差和相對偏差也較小,分別為0.16、2.54%。綜上,在雪茄煙樣相對濕度分析中,采用PLSR方法對提高模型的精度有一定的效果,但由于每個相對濕度下的樣品個數(shù)較少,模型計(jì)算可能存在一定的偶然性,需要后續(xù)進(jìn)一步就幾種方法進(jìn)行對比研究。表3所示為各回歸方法建立模型的具體結(jié)果,從表中也可以看出,PLSR模型效果較其他幾種方法模型結(jié)果好。
圖5 各回歸方法模型交叉驗(yàn)證圖
表3 雪茄煙樣相對濕度模型結(jié)果
(3)雪茄煙密度校正模型建立及評價(jià)
圖6所示為分別采用多元線性回歸和PLSR方法建立的模型交叉驗(yàn)證圖,由圖可知,雪茄煙建模樣品的試驗(yàn)點(diǎn)較好地分布在回歸線兩測,同時結(jié)合表4中兩種回歸方法建立模型參數(shù)分析,采用PLSR方法建立的模型相比多元線性回歸模型有較好的提升,其校正相關(guān)系數(shù)Rc從0.8806提高到0.9340,且RMSEC、RMSEP均有明顯減小,其中預(yù)測集絕對偏差為0.0027g·cm-3,相對偏差為1.14%,綜上表明,采用PLSR相比傳統(tǒng)多元線性回歸方法有較好的提升。
圖6 雪茄煙樣密度回歸模型交叉驗(yàn)證
表4 雪茄煙樣密度模型結(jié)果
(4)雪茄煙相對濕度、密度預(yù)測殘差分析
采用SPXY方法選擇總樣本中的30 %作為預(yù)測樣本,該樣本獨(dú)立于校正集樣本,通過預(yù)測樣本的實(shí)測值與預(yù)測值之間的偏差對模型預(yù)測準(zhǔn)確性進(jìn)行分析,同時使用成對t檢驗(yàn)對所建立模型預(yù)測值和化學(xué)方法測定的化學(xué)值進(jìn)行顯著性分析。具體結(jié)果見表5。由表5可知,針對雪茄煙相對濕度采用4種回歸方法進(jìn)行建模預(yù)測,其預(yù)測平均相對偏差分別為10.45%、2.38%、2.55%、2.61%,除采用傳統(tǒng)一元線性回歸方法預(yù)測偏差較大外,其余3種方法預(yù)測平均相對偏差均小于5 %,表明模型預(yù)測準(zhǔn)確性較高;同時,在顯著性水平為0.05時,根據(jù)t分布表中分別對應(yīng)的T值進(jìn)行分析,發(fā)現(xiàn)后面3種回歸方法預(yù)測集成對t檢驗(yàn)結(jié)果均小于對應(yīng)T值,表明校正模型的預(yù)測值與化學(xué)方法測定的化學(xué)值之間沒有顯著性差異。
表5 各模型預(yù)測殘差結(jié)果
對于雪茄煙密度模型而言,采用PLSR方法建立的模型,在預(yù)測集表現(xiàn)上也較多元線性回歸模型好,其預(yù)測標(biāo)準(zhǔn)偏差減小了近3倍,表明該模型檢測精度較前者有較大提升。
研究采用多種回歸方法對微波諧振法測量雪茄煙支相對濕度、密度進(jìn)行對比與建模分析,創(chuàng)造性地提出了采用化學(xué)計(jì)量學(xué)相關(guān)算法對微波數(shù)據(jù)進(jìn)行分析,從數(shù)理統(tǒng)計(jì)角度,提高模型的穩(wěn)定性和檢測精度。與傳統(tǒng)線性回歸相比,采用化學(xué)計(jì)量學(xué)相關(guān)算法(如PCA、PLSR等)可以有效避免用微波中心頻點(diǎn)與帶寬變化的比值等進(jìn)行建模分析帶來的數(shù)據(jù)敏感性和不穩(wěn)定性。采用PCA對微波數(shù)據(jù)進(jìn)行特征提取,同時利用PLSR建模分析,在雪茄煙相對濕度、密度分析中,將傳統(tǒng)的一/多元線性回歸模型的檢測誤差從0.58%、0.0093g·cm?3,分別減小到0.19%和0.0035g·cm?3。試驗(yàn)結(jié)果同樣證實(shí),采用化學(xué)計(jì)量學(xué)方法能夠有效提高模型檢測精度,對于后期模型修正和轉(zhuǎn)移維護(hù)提供了一定的思路。