蘇鵬飛,張武崗
(陜西西鳳酒股份有限公司,陜西寶雞 721400)
近年來,隨著釀酒企業(yè)的快速發(fā)展和不斷擴(kuò)產(chǎn),對釀酒原糧高粱的需求量日益增多,同時(shí)對其品質(zhì)和分析效率有了更高的要求。高粱品質(zhì)的控制對釀造白酒質(zhì)量至關(guān)重要,而淀粉含量是釀酒企業(yè)監(jiān)控高粱品質(zhì)的重要質(zhì)量指標(biāo),淀粉作為主要的糖化底物,經(jīng)糊化、水解產(chǎn)生大量發(fā)酵糖類,再通過酵母菌等微生物的分解,最終產(chǎn)生白酒,其質(zhì)量與白酒工業(yè)的經(jīng)濟(jì)效益直接相關(guān)[1]。實(shí)驗(yàn)室測定高粱淀粉含量的常規(guī)方法是酸解法,但這種方法比較復(fù)雜,費(fèi)時(shí)費(fèi)力,而且需要使用多種有毒有害化學(xué)試劑,不滿足企業(yè)對綠色、環(huán)保的追求和對樣品快速分析發(fā)展的需要。因此,亟待開發(fā)一種快速、高效以及環(huán)保的分析技術(shù)。近紅外光譜技術(shù)(NIR)是近幾年發(fā)展較為迅速的一種快檢技術(shù),所受關(guān)注度也越來越高,這種技術(shù)具有高效穩(wěn)定、操作簡便以及無污染等優(yōu)點(diǎn),是一種能夠滿足快速分析的綠色技術(shù),已普遍應(yīng)用于食品行業(yè)[2-8]。近紅外光譜區(qū)的波長范圍為780~2526 nm,由分子振動(dòng)從基態(tài)向高能態(tài)躍遷時(shí)所產(chǎn)生,主要是一些含氫基團(tuán)分子X-H(X:C、N、O 等)內(nèi)部振動(dòng)的倍頻與合頻吸收帶[9-11]。高粱淀粉指標(biāo)在近紅外區(qū)可得到有效響應(yīng),將高粱樣品近紅外光譜圖與常規(guī)方法分析的一手?jǐn)?shù)據(jù)結(jié)合起來,通過相關(guān)建模軟件和方法最終建立其近紅外快檢模型,以期實(shí)現(xiàn)高粱淀粉含量的快速分析,為企業(yè)提質(zhì)增效提供技術(shù)支持。
實(shí)驗(yàn)樣品:西鳳酒廠釀酒用高粱,共220 個(gè)建模樣品,樣品具有代表性。
儀器設(shè)備:FW-200AD 粉碎機(jī),天津鑫博得儀器有限公司;ME204/02 電子天平,瑞士METTLER TOLEDO 公司;HH-S6A 電熱恒溫水浴鍋,北京科偉永興儀器有限公司;H22-X3電爐,杭州九陽生活電器有限公司;Antaris II 傅里葉變換近紅外光譜儀、RESULT 操作軟件以及TQAnalyst 光譜分析軟件等,美國Thermo Fisher公司。
1.2.1 高粱樣品淀粉含量的測定
高粱樣品的淀粉含量參考GB 5009.9—2016 酸水解法進(jìn)行測定。重復(fù)2次,取平均值。
1.2.2 近紅外光譜采集條件
在采集樣品光譜前,首先檢查儀器的狀態(tài),確保儀器正常且穩(wěn)定時(shí),再將提前粉碎好的高粱樣品裝于5 cm 的樣品旋轉(zhuǎn)杯中,并用壓樣器壓緊,避免出現(xiàn)縫隙,然后將樣品杯放置于測量池上進(jìn)行測量,最后通過RESULT 光譜采集及分析軟件對高粱樣品進(jìn)行光譜采集。光譜掃描范圍為4000~10000 cm-1,掃描次數(shù)為64次,儀器分辨率為8 cm-1,以內(nèi)置背景作為參比,重復(fù)2次,取平均光譜。
樣品光譜圖掃描完成后,及時(shí)利用常規(guī)分析方法對其淀粉含量進(jìn)行檢測,并使樣品的光譜圖和一手?jǐn)?shù)據(jù)相對應(yīng),即能夠?qū)悠返墓庾V信息進(jìn)行賦值。同時(shí),結(jié)合偏最小二乘法(PLS)、固定光程(Constant)、多元信號(hào)修正(MSC)、標(biāo)準(zhǔn)正則變換(SNV)、導(dǎo)數(shù)處理、Norris 平滑處理以及內(nèi)部交叉驗(yàn)證法(Cross-Validation)等近紅外光譜預(yù)處理方法進(jìn)行建模研究。運(yùn)用近紅外光譜預(yù)處理方法選擇最優(yōu)光譜波段和建模參數(shù),最終建立高粱淀粉含量的近紅外快速分析模型。
在對模型進(jìn)行評價(jià)時(shí),通常需從內(nèi)、外部兩方面共同進(jìn)行評價(jià)。內(nèi)部評價(jià)是通過模型的相關(guān)系數(shù)(R2)、均方差(RMSEC)、交叉驗(yàn)證均方差(RMSECV)以及預(yù)測均方差(RMSEP)等參數(shù)來判斷模型的質(zhì)量。其中,R2越大以及RMSEC、RMSECV和RMSEP 值越小且相近,說明所建模型的質(zhì)量越好[12-15]。外部評價(jià)是利用所建模型和常規(guī)方法分別對未參與建模的盲樣進(jìn)行分析,并通過分析結(jié)果的比較來評價(jià)模型的預(yù)測能力。
采用Microsoft Office Excel 2010軟件對數(shù)據(jù)進(jìn)行相關(guān)計(jì)算,采用SPSS 17.0 軟件對相關(guān)數(shù)據(jù)進(jìn)行差異顯著性分析(p<0.05)。
在采集高粱樣品光譜前,首先要確定光譜儀的分辨率、掃描次數(shù)以及樣品增益值等采集參數(shù),確保樣品光譜采集的一致性和準(zhǔn)確性,然后按照光譜采集的最優(yōu)條件和參數(shù)對高粱樣品進(jìn)行譜圖掃描。本研究是在近紅外全光譜4000~10000 cm-1范圍內(nèi)對高粱樣品進(jìn)行光譜掃描,掃描的高粱樣品原始光譜如圖1所示。
圖1 高粱樣品原始掃描光譜圖
由圖1 可以看出,在波數(shù)9000~10000 cm-1范圍內(nèi),高粱樣品吸光度較低且噪音干擾較大,不利于樣品有效信息的提取,不宜選擇此波段建立模型。另外,對樣品原始光譜進(jìn)行導(dǎo)數(shù)和Norris 平滑處理后(如圖2 所示),光譜圖變得更加精細(xì),這樣處理可以凈化譜圖,消除基線漂移,也可以起到一定放大和分離重疊信息的作用,利于提高樣品光譜的信噪比,也利于建模過程中對光譜信息的進(jìn)一步選擇。
圖2 二階導(dǎo)數(shù)和Norris平滑處理效果圖
將收集到的220 個(gè)高粱樣品,按照淀粉含量由低到高進(jìn)行排序,然后均勻地抽取20 個(gè)樣品進(jìn)行RMSEP分析,剩余的200個(gè)樣品作為校正集進(jìn)行建模。建立模型時(shí)要確保樣品的光譜圖和化驗(yàn)值相對應(yīng),然后運(yùn)用光譜預(yù)處理方法對樣品光譜信息進(jìn)行處理,選擇最佳建模波段和方法,并通過優(yōu)化檢驗(yàn)等過程,最終建立高粱淀粉含量的近紅外快檢模型。
表1 和圖3 分別為高粱淀粉含量建模的最優(yōu)參數(shù)和模型圖。由表1 和圖3 可知,高粱淀粉含量的最優(yōu)建模波段為8992.52~5703.68,最佳預(yù)處理方法為偏最小二乘法(PLS)、固定光程(Constant)、二階導(dǎo)數(shù)以及Norris 平滑處理,在此條件下所建立的高粱淀粉含量模型相關(guān)系數(shù)最大,標(biāo)準(zhǔn)偏差最小。其中,建模集的相關(guān)系數(shù)R2為0.9752,交叉驗(yàn)證集的相關(guān)系數(shù)R2為0.9018,預(yù)測驗(yàn)證集的相關(guān)系數(shù)R2為0.9714,說明模型的線性關(guān)系較好;同時(shí),模型的RMSEC、RMSECV和RMSEP值分別為0.207、0.389和0.211,模型內(nèi)部參數(shù)值較小且相近,說明模型的質(zhì)量較好。
表1 高粱淀粉含量模型參數(shù)
圖3 高粱淀粉含量模型
利用模型自身參數(shù)RMSEC、RMSECV 和RMSEP 來評價(jià)一個(gè)模型的質(zhì)量為內(nèi)部驗(yàn)證法,除此之外,還應(yīng)對所建模型進(jìn)行外部驗(yàn)證,通過內(nèi)、外部驗(yàn)證共同評價(jià)模型的質(zhì)量。
另取45 個(gè)高粱樣品作為盲樣進(jìn)行外部驗(yàn)證,利用所建模型和常規(guī)方法分別進(jìn)行分析,得出高粱淀粉含量的預(yù)測值和真實(shí)值。通過比較預(yù)測值和真實(shí)值,得到模型預(yù)測的準(zhǔn)確度和可靠性。
根據(jù)模型外部驗(yàn)證結(jié)果,如表2 所示,高粱淀粉含量模型預(yù)測的相對誤差均在2%以內(nèi),平均相對誤差為0.7 %,說明所建模型具有較好的預(yù)測能力。此外,為了對比兩種方法分析結(jié)果的差異性,采用SPSS 軟件對這45 個(gè)樣品的兩種方法檢測結(jié)果進(jìn)行差異顯著性分析,結(jié)果見表3。由表3 可知,兩種方法分別對樣品進(jìn)行分析檢測時(shí),兩組檢測值之間的差異顯著性分析結(jié)果P 值為0.415(P>0.05),說明兩組檢測值之間不存在顯著性差異。因此,在實(shí)際生產(chǎn)中,該模型可用于高粱淀粉含量的快速檢測。
表2 高粱淀粉含量模型外部驗(yàn)證結(jié)果
表3 兩組數(shù)據(jù)差異顯著性分析
利用近紅外光譜技術(shù)研究建立了高粱淀粉含量的快檢模型,模型的線性關(guān)系較好,并且模型內(nèi)部各參數(shù)值較小且相近,說明模型的質(zhì)量較好。同時(shí),利用所建模型和實(shí)驗(yàn)室常規(guī)方法分別對外部驗(yàn)證樣品進(jìn)行了分析比較,結(jié)果表明模型預(yù)測的準(zhǔn)確度和可靠性良好,在實(shí)際生產(chǎn)過程中,可用于高粱淀粉含量的檢測。此外,所建模型作為一個(gè)基礎(chǔ)模型,后期還需根據(jù)實(shí)際情況不斷對其進(jìn)行維護(hù)和優(yōu)化,確保模型預(yù)測的穩(wěn)定性和準(zhǔn)確性,以滿足日常生產(chǎn)檢測的需求。