熊雅婷,李宗朋,王 健,張 英,王淑軍,尹建軍,宋全厚
中國(guó)食品發(fā)酵工業(yè)研究院,北京 100015
近紅外光譜波段優(yōu)化在白酒酒醅成分分析中的應(yīng)用
熊雅婷,李宗朋,王 健*,張 英,王淑軍,尹建軍,宋全厚
中國(guó)食品發(fā)酵工業(yè)研究院,北京 100015
為了提高白酒酒醅主要成分的快速檢測(cè)技術(shù)水平,利用近紅外光譜法對(duì)白酒酒醅中的水份、淀粉、酸度和酒精度進(jìn)行定量分析,通過(guò)PLS建立酒醅成分定量分析模型,同時(shí)采用CARS、間隔偏最小二乘變量選擇法(iPLS)和無(wú)信息變量消除法(UVE),實(shí)現(xiàn)光譜特征波段選擇,并利用多元散射校正(MSC)、導(dǎo)數(shù)以及標(biāo)準(zhǔn)正態(tài)變量變換(SNV)等預(yù)處理方法進(jìn)行模型優(yōu)化。用決定系數(shù)(R2)、預(yù)測(cè)標(biāo)準(zhǔn)偏差(RMSEP)以及最佳主因子數(shù)對(duì)模型進(jìn)行評(píng)價(jià),確定最佳建模方法。結(jié)果表明:波段篩選能夠?qū)δP推鸬絻?yōu)化作用,并提高模型運(yùn)算速度,其中CARS優(yōu)化效果最為明顯,酒醅水份、淀粉、酸度和酒精度的R2分別達(dá)到0.885,0.915,0.951,0.954;RMSEP分別為0.630,0.519,0.228,0.234,有效地提高了模型的穩(wěn)定性與準(zhǔn)確度。經(jīng)過(guò)優(yōu)化,所建模型預(yù)測(cè)效果好,能夠滿足白酒酒醅主要成分的快速檢測(cè)要求,在實(shí)際應(yīng)用中有一定的參考價(jià)值。
白酒酒醅;近紅外光譜技術(shù);定量分析;預(yù)處理方法;波段篩選
酒醅發(fā)酵過(guò)程伴隨著水份,淀粉,以及酸度等主要成分含量的變化,影響白酒釀造的產(chǎn)量、質(zhì)量與風(fēng)味,因此,對(duì)酒醅中主要物質(zhì)及時(shí)檢測(cè)是控制白酒生產(chǎn)品質(zhì)的保障。目前傳統(tǒng)化學(xué)檢測(cè)方法存在操作繁雜,檢測(cè)結(jié)果延遲,準(zhǔn)確性差,污染環(huán)境,難以實(shí)現(xiàn)大批量快速定量檢測(cè)等缺點(diǎn)[1]。尋找一種快速、高效、清潔的檢測(cè)方法尤為重要。
近紅外光能夠穿透到酒醅樣品內(nèi)部,攜帶樣品內(nèi)部信息,所以可以采用漫反射技術(shù)對(duì)樣品直接測(cè)定。近紅外光譜(near infrared spectroscopy,NIR)技術(shù)操作簡(jiǎn)單、樣品無(wú)需前處理、易于實(shí)現(xiàn)快速分析,已經(jīng)在食品、藥品、石油化工、農(nóng)牧等領(lǐng)域廣泛應(yīng)用[2]。
目前,在白酒酒醅檢測(cè)方面,郝建國(guó)等[3]采用偏最小二乘回歸法(PLS)建立了汾酒酒醅中淀粉、酒精度、酸度、水份的定量分析模型,趙東等[4]分別對(duì)五糧液入窖、出窖酒醅的多種理化指標(biāo)進(jìn)行了建模與驗(yàn)證。以上研究結(jié)果均表明了近紅外光譜技術(shù)對(duì)單一香型白酒酒醅的快速檢測(cè)具有可行性,建立的模型具有較高預(yù)測(cè)能力。但是這些研究并未對(duì)模型進(jìn)行深入優(yōu)化。
實(shí)驗(yàn)綜合了濃香型,白干型和芝麻香型等多種香型的白酒酒醅,通過(guò)比較全光譜、CARS變量選擇法、間隔偏最小二乘變量選擇法(iPLS)和無(wú)信息變量消除法(UVE),深入探討光譜波段篩選方法對(duì)酒醅中淀粉、水份、酸度、酒精度指標(biāo)建模的影響,并通過(guò)對(duì)比確定最佳波段選擇方法及預(yù)處理方法,以此來(lái)降低模型復(fù)雜程度,提高模型運(yùn)算速度、穩(wěn)定性、準(zhǔn)確性以及模型預(yù)測(cè)能力,為快速評(píng)價(jià)酒醅質(zhì)量提供一定參考。
1.1 儀器設(shè)備
實(shí)驗(yàn)使用QC-leader傅里葉變換近紅外光譜儀(北京中安信達(dá)科技有限公司)。光譜儀光源為鹵鎢燈,檢測(cè)器為溫控InGaAs,配有固體測(cè)量池。光譜范圍為10 000~4000 cm-1,分辨率為8 cm-1,掃描次數(shù)為32;利用配套軟件 NIRWare Operator 采集樣品的近紅外光譜信息,采用UnscramblerX10.3光譜分析軟件(挪威CAMO公司)進(jìn)行光譜預(yù)處理、偏最小二乘計(jì)算,CARS, iPLS, UVE等程序均在MATLAB環(huán)境下運(yùn)行。
1.2 材料
實(shí)驗(yàn)所用濃香型,白干型和芝麻香型酒醅樣品共855個(gè),由某白酒企業(yè)提供。為保證實(shí)驗(yàn)可靠性及模型準(zhǔn)確性,對(duì)酒醅樣品進(jìn)行三次采樣,采用漫反射方式掃描采集酒醅近紅外光譜,并對(duì)光譜進(jìn)行平均。酒醅水份、淀粉、酸度實(shí)測(cè)值分別根據(jù)直接干燥法[中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)GB5009.3-2010]、酶水解法[中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)GB/T5009.9-2008]、[中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)GB/T5517-2010]測(cè)得。
1.3 光譜處理
1.3.1 校正集與驗(yàn)證集的劃分
采用Kennard-Stone(K-S)法[5]進(jìn)行樣本集劃分,基于變量之間的歐氏距離在特征空間中均勻選取樣本,可以直接采用光譜作為特征變量,也可以將光譜進(jìn)行主成分分析后,選用主成分得分為特征變量選擇樣本。
最終選擇了600個(gè)酒醅樣品作為校正集,255個(gè)樣品作為驗(yàn)證集,表1為校正集與驗(yàn)證集的統(tǒng)計(jì)信息。
Table 1 Statistical results of calibration set and validation set
1.3.2 光譜變量選擇
為了剔除無(wú)用變量,降低模型復(fù)雜度,提高模型準(zhǔn)確度,分別采用CARS[6]、間隔偏最小二乘(iPLS)[7]以及無(wú)信息變量消除法(UVE)[8]將進(jìn)行光譜優(yōu)選,根據(jù)決定系數(shù)R2、預(yù)測(cè)標(biāo)準(zhǔn)偏差RMSEP以及最佳主成分?jǐn)?shù)得出最適合的光譜變量選擇方法[9]。在選定的主成分?jǐn)?shù)下,R2越接近1,RMSEP越接近0,表明模型效果越好[10]。
1.3.3 光譜預(yù)處理
改革后的“X+1+X”運(yùn)營(yíng)模式,增加了用戶選擇權(quán),提高了管道服務(wù)質(zhì)量,推動(dòng)了定價(jià)機(jī)制市場(chǎng)化,改革后多個(gè)供應(yīng)商、銷售商與用戶談判博弈,價(jià)格由市場(chǎng)決定,價(jià)格更趨合理。
近紅外原始光譜包含許多干擾因素,影響模型效果。為了消除顆粒分布不均,減弱基線漂移以及噪音的影響[11],選用多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(SNV)以及導(dǎo)數(shù)等預(yù)處理方法對(duì)光譜進(jìn)行預(yù)處理,以提高模型準(zhǔn)確性和可靠性。
2.1 光譜波段優(yōu)選
2.1.1 CARS(competitive adaptive reweighted sampling)波段選擇法
Table 2 Results of CARS band filtering
Fig.1 Variable selection with CARS
2.1.2 間隔偏最小二乘波段選擇法(interval PLS,iPLS)
將樣品數(shù)據(jù)分割成15個(gè)等距波段進(jìn)行PLS計(jì)算并交互驗(yàn)證,其波段篩選結(jié)果如圖2所示。其中,縱坐標(biāo)表示了各個(gè)波段交互驗(yàn)證均方差(RMSECV),虛線(M)表示全光譜區(qū)間建模時(shí)的交互驗(yàn)證均方差[14]。本實(shí)驗(yàn)選擇位于虛線以下的波段進(jìn)行建模,酒精度建模波段為1,2,5,12號(hào)波段;淀粉為2號(hào)、5號(hào)波段;水分為2,4,5號(hào)波段;酸度為2,5,12號(hào)波段。
Fig.2 iPLS variable screening results
(a):Alcohol;(b):Starch;(c):Moisture;(d): Acidity
2.1.3 無(wú)信息變量消除法(elimination of uninformative variables, UVE)
UVE是一種基于回歸系數(shù)穩(wěn)定性分析的變量選擇方法,對(duì)全光譜采用UVE方法進(jìn)行變量?jī)?yōu)選,變量穩(wěn)定性分析結(jié)果如圖3所示。豎直實(shí)線左邊是波長(zhǎng)變量,右邊為引入的系統(tǒng)噪音變量。虛線表示變量穩(wěn)定性的上下閾值,處于兩閾值之間的變量可認(rèn)為是無(wú)關(guān)的信息量,超出閾值的部分為有用信息波長(zhǎng)變量[15],因此實(shí)驗(yàn)選擇超出虛線閾值的光譜波段建模。
Fig.3 UVE variable stability analysis results
(a):Alcohol;(b):Starch;(c):Moisture;(d): Acidity
在上述各變量篩選方法的基礎(chǔ)上,分別建立酒醅4個(gè)指標(biāo)的全光譜-PLS,CARS-PLS,UVE-PLS,iPLS-PLS定量模型,并計(jì)算得出最佳主因子數(shù),同時(shí)比較決定系數(shù)R2和預(yù)測(cè)標(biāo)準(zhǔn)偏差RMSEP,以此來(lái)評(píng)價(jià)模型效果,模型計(jì)算結(jié)果如表3所示。
Table 3 Quantitative model validation results of Fermented grains
從表3可以看出,各項(xiàng)指標(biāo)經(jīng)光譜波段選擇之后,變量數(shù)顯著減少,R2普遍較全光譜增大,同時(shí)RMSEP相對(duì)減小,主成分?jǐn)?shù)有不同程度的減少,模型運(yùn)算速度均有不同程度的提高,說(shuō)明波段篩選能夠有效優(yōu)化模型。
比較三種波段選擇方法,iPLS-PLS方法因等間距劃分波長(zhǎng)導(dǎo)致波長(zhǎng)點(diǎn)選擇不夠精準(zhǔn),但是有效地減少了主成分?jǐn)?shù)量,有利于提高模型預(yù)測(cè)能力。UVE-PLS法篩選的變量數(shù)過(guò)多,導(dǎo)致模型預(yù)測(cè)性、準(zhǔn)確度不夠,在酒精度測(cè)量結(jié)果中雖然R2、RMSEP優(yōu)于其他方法,但是主成分?jǐn)?shù)過(guò)多,可能引入噪音,在酸度測(cè)量中R2、RMSEP結(jié)果較差,模型穩(wěn)定性和準(zhǔn)確度有待提高。相比之下CARS-PLS法表現(xiàn)出更大的優(yōu)勢(shì),經(jīng)過(guò)篩選,變量數(shù)極大減少,有效保留了關(guān)鍵特征波長(zhǎng),降低了模型的復(fù)雜程度,加快了運(yùn)算速度,R2較原光譜增大1%以上,同時(shí) RMSEP減少,最佳主成分?jǐn)?shù)合理,四種理化指標(biāo)的模型穩(wěn)定性和準(zhǔn)確性均有較大的提高??傊?,CARS-PLS法是最合適的白酒酒醅變量篩選法,能有效篩選出數(shù)量更少且合理的波長(zhǎng)變量。
2.3 光譜預(yù)處理
導(dǎo)數(shù)光譜可有效的消除基線和其他背景干擾,提高分辨率和靈敏度,與S-G平滑結(jié)合使用能有效的降低噪聲[16]。SNV與MSC的目的主要是消除顆粒分布不均勻及顆粒大小產(chǎn)生的散射影響。對(duì)CARS法波段選擇結(jié)果用多元散射校正(MSC)、一階、二階導(dǎo)數(shù)結(jié)合9點(diǎn)Savitzky-Golay平滑以及SNV的方法分別對(duì)光譜進(jìn)行預(yù)處理,并對(duì)酒醅指標(biāo)進(jìn)行PLS建模,結(jié)果如表4所示。
Table 4 Results of fermented grains preprocessing analysis
由表4數(shù)據(jù)可見(jiàn),在CARS法已選擇的波段范圍內(nèi),對(duì)于水份和酸度,二階9點(diǎn)S-G平滑法相比于原光譜有明顯優(yōu)化效果,決定系數(shù)R2分別達(dá)到0.901和0.952,RMSEP分別達(dá)到0.618和0.218;對(duì)于淀粉,MSC及SNV均表現(xiàn)出了良好的預(yù)處理效果,R2達(dá)到0.921,預(yù)測(cè)標(biāo)準(zhǔn)偏差RMSEP為0.509;對(duì)于酒精度,一階9點(diǎn)S-G平滑效果最好,R2為0.955,RMSEP為0.225。
結(jié)果表明,合理地使用預(yù)處理方法能有效的提高模型穩(wěn)健性,模型的各項(xiàng)指標(biāo)均有所改善。但是大部分光譜預(yù)處理方法在運(yùn)算過(guò)程中,會(huì)引入或放大噪聲,或者減少光譜真正的樣品信息,最終導(dǎo)致光譜信噪比下降,因此,有時(shí)會(huì)出現(xiàn)部分預(yù)處理后光譜模型質(zhì)量下降,效果差于原光譜的現(xiàn)象。
2.4 模型驗(yàn)證
將60個(gè)未參與建模的樣品光譜帶入經(jīng)CARS及相應(yīng)預(yù)處理方法優(yōu)化的模型中進(jìn)行驗(yàn)證,由圖4可以看到,各理化指標(biāo)的實(shí)測(cè)值與預(yù)測(cè)值點(diǎn)呈對(duì)角線分布,且經(jīng)成對(duì)t檢驗(yàn),各項(xiàng)指標(biāo)預(yù)測(cè)值與實(shí)測(cè)值無(wú)明顯差異。經(jīng)驗(yàn)證,酒精度R2為0.950 2,RMSEP為0.243 8;淀粉R2為0.907 8,RMSEP為0.536 2;水份R2為0.876 9,RMSEP為0.661 7;酸度R2為0.943 3,RMSEP為0.273 1;說(shuō)明,模型的預(yù)測(cè)結(jié)果較為準(zhǔn)確。
采用近紅外光譜法對(duì)白酒酒醅的淀粉、水份、酸度和酒精度指標(biāo)進(jìn)行了定量檢測(cè),通過(guò)對(duì)光譜特征波長(zhǎng)選取,提高了模型的預(yù)測(cè)精度和穩(wěn)定性,證實(shí)了波段優(yōu)化對(duì)建模分析的重要性。此外,通過(guò)多種預(yù)處理方法比較發(fā)現(xiàn),不同樣品組分對(duì)預(yù)處理的需求不同,只有選擇合適的預(yù)處理方法,才能最大限度的消除噪聲及干擾因素,建立最優(yōu)數(shù)學(xué)模型。
研究結(jié)果表明,CARS,iPLS,UVE三種波段篩選方法均能在不同程度上減少建模所用變量數(shù),有助于模型優(yōu)化。其中,CARS篩選變量的PLS建模效果更為理想,經(jīng)CARS篩選后,建模波段明顯減少,R2和RMSEP也表現(xiàn)出了較好精度,所得變量包含了成分中C—H,C—O,O—H等官能團(tuán)的主要吸收峰所在區(qū)域,既保留了酒醅各項(xiàng)成分的特征波長(zhǎng),又有效地剔除了大部分無(wú)信息變量,實(shí)現(xiàn)了波長(zhǎng)選擇的目標(biāo),說(shuō)明該方法可能更適用于白酒酒醅的定量檢測(cè)。同時(shí),針對(duì)酒醅不同指標(biāo)進(jìn)行適當(dāng)光譜預(yù)處理,能顯著提高模型預(yù)測(cè)能力。通過(guò)對(duì)建模波段以及預(yù)處理方法進(jìn)行合理篩選,為實(shí)時(shí)、準(zhǔn)確監(jiān)控多香型白酒酒醅主要指標(biāo)含量變化,以及科學(xué)優(yōu)化近紅外光譜模型提供了一定的參考依據(jù)。
Fig.4 Quantitative model of the measured values and near infrared prediction
[1] HAO Jian-guo, REN Jing-jing (郝建國(guó), 任晶婧). Liquor-Making Science & Technology(釀酒科技), 2011, 5: 106.
[2] LI Zong-peng, WANG Jian, ZHANG Xiao-lei, et al(李宗朋, 王 健, 張曉磊, 等). China Oils and Fats(中國(guó)油脂), 2014, 39(2): 57.
[3] ZHAO Dong, LI Yang-hua, LAN Shi-rong, et al(趙 東, 李楊華, 蘭世榮, 等). Liquor-Making Science & Technology (釀酒科技), 2004, 1: 72.
[4] ZHAO Dong, LI Yang-hua, ZHOU Xue-qiu, et al(趙 東, 李楊華, 周學(xué)秋, 等). Chinese Journal of Spectroscopy Laboratory(光譜實(shí)驗(yàn)室), 2003, 20(4): 614.
[5] CHU Xiao-li(褚小立). Molecular Spectroscopy Analytical Technology Combined with Chemometrics and its Applications (化學(xué)計(jì)量學(xué)方法與分子光譜分析技術(shù)). Beijing: Chemical Industry Press(北京:化學(xué)工業(yè)出版社), 2011. 4.
[6] Li Hongdong, Liang Yizeng, Xu Qingsong. Analytica Chimica Acta, 2009, 648: 77.
[7] LIU Yan-yun, HU Chang-qin(柳艷云,胡昌勤). Chinese Journal of Pharmaceutical Analysis(藥物分析雜志), 2010, 30(5): 968.
[8] LI Qian-qian, TIAN Kuang-da, LI Zu-hong, et al(李倩倩, 田曠達(dá), 李祖紅, 等). Analytical Chemistry(分析化學(xué)研究報(bào)告), 2013, 41(6): 917.
[9] HUANG Fu-rong, LI Shi-ping, YU Jian-hui, et al(黃富榮, 李仕萍, 余健輝, 等).Chinese Journal of Spectroscopy Laboratory(光譜實(shí)驗(yàn)室), 2011, 28(6): 2774.
[10] ZHANG Hua-xiu, LI Xiao-ning, FAN Wei, et al(張華秀, 李曉寧, 范 偉, 等). Journal of Instrumental Analysis(分析測(cè)試學(xué)報(bào)), 2010, 29(5): 430.
[11] LI Shui-fang, SHAN Yang, FAN Wei, et al. (李水芳, 單 楊, 范 偉, 等). Food Science(食品科學(xué)), 2011, 32(8): 182.
[12] Lü Qiang, HE Shao-lan, LIU Bin, et al(呂 強(qiáng), 何紹蘭, 劉 斌, 等). Transactions of the Chinese Society for Agricultural Machinery(農(nóng)業(yè)機(jī)械學(xué)報(bào)), 2012, 10(43): 211.
[13] WEN Zhen-cai, SUN Tong, GENG Xiang, et al(溫珍才, 孫 通, 耿 響, 等). Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2013, 33(9): 2354.
[14] Chen Huazhou, Tao Pan, Chen Jiemei, et al. Chemometrics and Intelligent Laboratory Systems, 2011, 107: 139.
[15] He Kaixun, Cheng Hui, Du Wenli, et al. Chemometrics and Intelligent Laboratory Systems, 2014, 134: 79.
[16] TANG Li(唐 利). Liquor-Making Science & Technology(釀酒科技), 2012, (4): 65.
*Corresponding author
The Near Infrared Spectral Bands Optimal Selection in the Application of Liquor Fermented Grains Composition Analysis
XIONG Ya-ting,LI Zong-peng,WANG Jian*,ZHANG Ying,WANG Shu-jun,YIN Jian-jun,SONG Quan-hou
China National Research Institute of Food and Fermentation Industries,Beijing 100015, China
In order to improve the technical level of the rapid detection of liquor fermented grains, in this paper, use near infrared spectroscopy technology to quantitative analysis moisture, starch, acidity and alcohol of liquor fermented grains. Using CARS, iPLS and no information variable elimination method (UVE), realize the characteristics of spectral band selection. And use the multiple scattering correction (MSC), derivative and standard normal variable transformation (SNV) pretreatment method to optimize the models. Establish models of quantitative analysis of fermented grains by PLS, and in order to select the best modeling method, usingR2, RMSEP and optimal number of main factors to evaluate models. The results showed that the band selection is vital to optimize the model and CARS is the best optimization of the most significant effect. The calculation results showed thatR2of moisture,starch,acidity and alcohol were 0.885, 0.915, 0.951, 0.885 respectively and RMSEP of moisture,starch,acidity and alcohol were 0.630, 0.519, 0.228, 0.234 respectively. After optimization, the model prediction effect is good, the models can satisfy the requirement of the rapid detection of liquor fermented grains, which has certain reference value in the practical.
Liquor fermented grains; Near infrared spectroscopy; Quantitative analysis; Pretreatment method; Band selection
Sep. 1, 2014; accepted Dec. 15, 2014)
2014-09-01,
2014-12-15
科研院所技術(shù)開(kāi)發(fā)研究專項(xiàng)項(xiàng)目(2013EG111212)資助
熊雅婷,1990年生,中國(guó)食品發(fā)酵工業(yè)研究院碩士研究生 e-mail:xiongyating1130@163.com *通訊聯(lián)系人 e-mail:onlykissjohn@hotmail.com
O657.3
A
10.3964/j.issn.1000-0593(2016)01-0084-07