田 靜,王曉娟,齊文良,梁振楠,陳 斌*
(1.江蘇大學(xué) 食品與生物工程學(xué)院,江蘇 鎮(zhèn)江 212013;2.寧波海關(guān)技術(shù)中心,浙江 寧波 315048)
隨著塑料化工技術(shù)的迅速發(fā)展,塑料制品在生活中的應(yīng)用愈發(fā)廣泛,食品和藥品會直接接觸到大量塑料制品,因此塑料制品的安全性將會直接影響消費(fèi)者身體健康[1-3]。聚乙烯(Polyethylene,PE)和聚丙烯(Polypropylene,PP)是最廣泛應(yīng)用于食品、藥品直接接觸的塑料制品,但由于PE和PP的耐熱性和拉伸強(qiáng)度等性質(zhì)相差較大,故兩者的適用場合和成本差異較大。不法廠商為節(jié)約成本,使用不符合國家標(biāo)準(zhǔn)的塑料制品作為食品和藥品的內(nèi)包裝材料,嚴(yán)重威脅消費(fèi)者健康,因此對食用級塑料包裝材料的鑒別尤為重要。
目前,對塑料制品種類的判別方法有燃燒法、溶解法、靜電法、光學(xué)法、熱分析法等[4-6],但這些方法在時間、工序及成本上存在很多不足。近紅外光譜技術(shù)具有快速、綠色、無損、成本低等優(yōu)點,被廣泛應(yīng)用于聚合材料以及農(nóng)產(chǎn)品的品質(zhì)檢測[7]。近紅外光譜區(qū)是含氫基團(tuán)(C—H、N—H、O—H)的倍頻與合頻吸收區(qū),利用該區(qū)域的吸收信息可進(jìn)行含氫基團(tuán)物質(zhì)的定性定量檢測[8],將近紅外光譜與化學(xué)計量學(xué)方法結(jié)合建立定性定量模型,可快速判別塑料原料的種類和制品品質(zhì)[9-10]。本研究基于近紅外漫反射光譜分析技術(shù),對食品和藥品的外包裝常用塑料材料PE和PP進(jìn)行定性判別,通過選取不同波長范圍、不同光譜預(yù)處理方法,在主成分分析的基礎(chǔ)上,采用多種模式識別算法,建立了定性校正模型,并通過比較各個模型性能的預(yù)測效果,優(yōu)選出最佳預(yù)測模型,以期為塑料及塑料制品材質(zhì)的種類快速鑒別提供參考。
塑料樣品(包括PP和PE)共100個,由寧波市檢驗檢疫局提供。其中,PP新生料17個,PP再生料15個,PE新生料36個,PE再生料32個,樣品分類情況見表1。
表1 塑料樣品類別個數(shù)統(tǒng)計表Table 1 Statistical table of plastic sample categories
S450近紅外光譜分析儀(上海棱光技術(shù)有限公司),儀器內(nèi)置聚四氟乙烯參比模塊,可自動完成參比校正和波長監(jiān)控,并配有聚四氟乙烯積分球漫反射系統(tǒng)和樣品旋轉(zhuǎn)裝置,適合粉末狀、顆粒狀樣品的測量。
在室溫(25 ℃)條件下,將裝有塑料樣品的樣品杯置于采集窗口進(jìn)行光譜采集(波長范圍900~2 500 nm),取每個塑料樣品掃描3次的平均光譜進(jìn)行后續(xù)數(shù)據(jù)分析,共采集100個樣品的近紅外光譜。
塑料樣品采用Kennard-Stone(K-S)方法進(jìn)行樣品集劃分,校正集與預(yù)測集比例為70∶30。
在采集塑料樣品光譜圖的過程中,為減少塑料樣品密度與形態(tài)不同以及表面特征不均勻等因素的影響,并降低干擾因素產(chǎn)生的噪聲,通常需對光譜進(jìn)行預(yù)處理,以提高定性校正模型的預(yù)測精確性。采用矢量歸一化、標(biāo)準(zhǔn)正態(tài)變量變換(Standard normal variate transformation,SNV)、中心化、滑動均值濾波(Moving average filtering,MAF)、多項式平滑濾波(Savitzky-Golay filtering,SGF)、一階微分方法對光譜預(yù)處理[11-16]。
使用江蘇大學(xué)近紅外研究小組自主開發(fā)的NIRSA4.5數(shù)據(jù)處理軟件進(jìn)行光譜預(yù)處理和定性校正模型的建立。
采用主成分分析結(jié)合簇類的獨(dú)立軟模式方法(Soft independent modeling of class analogy,SIMCA)、貝葉斯判別(Bayes discriminant analysis,BDA)、K-近鄰(K-Nearest neighbor,KNN) 3種方法建立兩類塑料樣品的定性校正模型。主成分分析是通過線性變換來提取近紅外光譜中主要特征分量的數(shù)據(jù)降維方法,SIMCA方法是一種建立在主成分分析基礎(chǔ)上的模式識別方法,根據(jù)模型的擬合結(jié)果對其判別歸類。貝葉斯判別是通過計算總體各自出現(xiàn)的概率大小,對未知類別樣品進(jìn)行歸類,將未知樣品歸屬于出現(xiàn)概率最大的一類。K-近鄰是直接利用已有的帶有類別標(biāo)記的樣本集(稱為訓(xùn)練樣本集)分類待分樣本(訓(xùn)練樣本集中觀察到的鄰近樣本)。正確識別率(CRR,%)是用于評價定性校正模型精度的指標(biāo),CRR越高(越接近100%)表明模型的判別精度越高,具體計算公式為:CRR=m1/m2×100%,式中m1為正確識別樣品數(shù),m2為樣品總數(shù)。
圖1 塑料樣品的原始近紅外光譜圖Fig.1 Raw NIR spectra of plastic samples
圖2 原始光譜前10個主成分的累計貢獻(xiàn)率趨勢圖Fig.2 Cumulative contribution rate trend of the first 10 principal components extracted from the original spectrum
2類4種PP與PE塑料樣品的近紅外漫反射原始光譜圖如圖1所示。由圖可見,PE和PP塑料的新生料近紅外光譜圖無太大差異,均在1 213 nm和1 394 nm處有較強(qiáng)吸收峰,這可能由樣品中C—H基團(tuán)、C—H2基團(tuán)的倍頻和合頻振動造成。但兩類塑料的再生料與新生料在1 000~1 800 nm 波段范圍內(nèi)的原始光譜吸光度相差較大,可能由于再生料因反復(fù)使用夾帶了一定的雜質(zhì)。因兩類塑料的吸收峰形和位置均較為相似,無法通過近紅外圖譜直觀鑒別,需將樣品的光譜數(shù)據(jù)結(jié)合化學(xué)計量學(xué)方法進(jìn)行分析及判別。
在主成分提取中,累計貢獻(xiàn)率能夠反映前n個主成分對原始數(shù)據(jù)的信息表征能力,塑料樣品近紅外光譜的前10個主成分(PC1~PC10)的累計貢獻(xiàn)率趨勢圖見圖2,圖中可見前3個主成分(PC1、PC2、PC3)的累計貢獻(xiàn)率為99.22%,已接近100%,表明前3個主成分已可表征大部分光譜信息,因此數(shù)據(jù)分析均選取塑料樣品前3個主成分?jǐn)?shù)建立各種判別定性校正模型。
2.3.1 波段對定性校正模型判別精度的影響不同的波長范圍所含有的塑料樣品屬性信息不同,建立的定性校正模型判別精度也不同。塑料樣品原始光譜選取不同波長區(qū)域的3種分類方法建立的模型預(yù)測結(jié)果見表2。由表中數(shù)據(jù)可見,在不同波長區(qū)間內(nèi),3種方法建立的定性校正模型均在1 050~1 550 nm波長范圍內(nèi)的效果較好,此區(qū)域內(nèi)SIMCA方法校正集和預(yù)測集的正確識別率分別為91.4%和86.7%,貝葉斯判別的校正集和預(yù)測集的正確識別率分別為74.3%和63.3%,K-近鄰方法的校正集和預(yù)測集的正確識別率分別為100%和100%。
表2 原始光譜不同波長區(qū)間的3種分類定性模型分類錯誤的樣品數(shù)統(tǒng)計分析Table 2 Statistical analysis of the number of wrong samples of three classification qualitative models with different wavelength intervals in the original spectrum
(續(xù)表2)
2.3.2 預(yù)處理方法對定性校正模型判別精度的影響在優(yōu)化得出的最優(yōu)波長區(qū)域內(nèi),使用SIMCA方法和貝葉斯判別2種識別方法結(jié)合不同預(yù)處理方法建立定性校正模型,比較不同光譜預(yù)處理方法對定性校正模型判別精度的影響,進(jìn)一步提高模型的判別精度。表3為1 050~1 550 nm波段范圍采用不同光譜預(yù)處理方法的上述2種方法定性校正模型的統(tǒng)計分析結(jié)果。由表中數(shù)據(jù)可見,SIMCA方法結(jié)合SNV+5點MAF平滑、SNV+5點SGF平滑或者SNV+5點SGF平滑預(yù)處理方法預(yù)測模型判別精度最好,預(yù)測模型精度得以顯著提高,樣品校正集和預(yù)測集的正確識別率分別為95.7%和93.3%,表明該預(yù)處理方法可提取樣品近紅外光譜中的有效信息,減少了噪音干擾,提高了預(yù)測模型精度;貝葉斯判別結(jié)合SNV+5點MAF平滑光譜預(yù)處理的預(yù)測模型判別精度最好,其中樣品校正集和預(yù)測集的正確識別率分別為97.1%和93.3%。
表3 不同預(yù)處理方法的2種分類定性模型的分類錯誤的樣品數(shù)統(tǒng)計分析Table 3 Statistical analysis of the number of wrong samples of two classification qualitative models with different pretreatment methods
表4為3種分類方法在不同波段范圍、不同預(yù)處理方法下得到的最優(yōu)定性校正模型的各類樣品分類錯誤的樣品數(shù)統(tǒng)計。由表4數(shù)據(jù)可見,在1 050~1 550 nm波段范圍內(nèi),SIMCA方法采用SNV+5點MAF平滑或者SNV+5點SGF平滑光譜預(yù)處理方法的預(yù)測模型對于PP新生料與再生料樣品區(qū)分效果較好;貝葉斯判別采用SNV+5點MAF平滑預(yù)處理方法的預(yù)測模型對于PP新生料與再生料區(qū)分效果較好;K-近鄰方法采用原始光譜建立的預(yù)測模型對2類4種PP與PE塑料樣品的分類效果最好。
表4 3種分類方法的最優(yōu)定性校正模型分類錯誤的樣品數(shù)統(tǒng)計Table 4 Statistics of the number of misclassified samples of the optimal qualitative correction model under the three classification methods
本研究采用主成分分析法結(jié)合3種不同模式識別方法(SIMCA、貝葉斯判別、K-近鄰)建立了PP和PE定性校正模型,結(jié)果顯示:3種模式識別方法在1 050~1 550 nm波長內(nèi)建立的定性模型判別精度最好;采用矢量歸一化、標(biāo)準(zhǔn)正態(tài)變量變換、中心化、滑動均值濾波、多項式平滑濾波、一階微分6種光譜預(yù)處理方法和上述3種模式識別方法對塑料樣品近紅外光譜進(jìn)行數(shù)據(jù)處理發(fā)現(xiàn),在1 050~1 550 nm范圍內(nèi)未經(jīng)光譜預(yù)處理,前3個主成分空間下的K-近鄰定性校正模型判別精度最好,樣品校正集和預(yù)測集的正確識別率均接近100%。該檢測方法具有結(jié)果準(zhǔn)確、耗時短、無損等優(yōu)點,可為食品包裝材料聚乙烯、聚丙烯的快速鑒別提供新方法。