余松柏,趙小波,2,田 敏,鄒勝瓊,劉夢(mèng)婕,周 軍,2,張宿義,2,3
(1.瀘州老窖股份有限公司,四川瀘州 646000;2.國(guó)家固態(tài)釀造工程技術(shù)研究中心,四川瀘州 646000;3.釀酒生物技術(shù)及應(yīng)用四川省重點(diǎn)實(shí)驗(yàn)室,四川瀘州 646000)
白酒酒醅的常規(guī)理化分析,作為釀酒企業(yè)重要的質(zhì)量控制手段,其結(jié)果對(duì)于釀酒生產(chǎn)指導(dǎo)、酒醅配料調(diào)整、質(zhì)量控制有著不可替代的作用。但是傳統(tǒng)的理化分析方法存在著工作量大、耗時(shí)長(zhǎng)、耗費(fèi)人力多、結(jié)果反饋不及時(shí)等諸多問(wèn)題,制約著其在大規(guī)模生產(chǎn)中的進(jìn)一步應(yīng)用。為解決此類問(wèn)題,近紅外光譜分析技術(shù)近年來(lái)逐漸引起行業(yè)從業(yè)人員的注意,利用其快速、無(wú)損、操作簡(jiǎn)單等特點(diǎn),以期達(dá)到白酒酒醅的快速、大批量檢測(cè)。
近紅外光是指介于可見光與中紅外光之間的電磁波,其波長(zhǎng)介于0.75~2.5 μm之間,近紅外光譜主要是由于分子振動(dòng)的非諧振性使分子振動(dòng)從基態(tài)向高能級(jí)躍遷時(shí)所產(chǎn)生,其主要記錄的是含氫基團(tuán)XH(X:C、N、O 等)振動(dòng)的倍頻與合頻吸收[1-2]。近紅外光譜技術(shù)由于其操作簡(jiǎn)單,無(wú)損,無(wú)需前處理等優(yōu)點(diǎn),近年來(lái),已在食品、化工、醫(yī)藥等行業(yè)廣泛應(yīng)用[3]。此外,在“中國(guó)制造2025”“工業(yè)4.0”等強(qiáng)調(diào)智能制造的大環(huán)境中,白酒生產(chǎn)向著機(jī)械化、信息化、智能化的發(fā)展必定是今后行業(yè)的發(fā)展方向,近紅外其自身具有的大批量、可移動(dòng)車載式以及在線檢測(cè)等潛在的應(yīng)用優(yōu)勢(shì),在白酒行業(yè)的廣泛應(yīng)用,為白酒產(chǎn)業(yè)智能化發(fā)展奠定了技術(shù)上的可能。
近20 年以來(lái),研究人員不斷嘗試將近紅外光譜技術(shù)應(yīng)用于白酒酒醅的分析。2003年,五糧液集團(tuán)的趙東等[1,4]首次將近紅外光譜技術(shù)應(yīng)用于白酒的酒醅分析,研究人員使用布魯克的Vector 22/N型近紅外儀器,用于分析酒醅的酸度、淀粉、水分指標(biāo),完成了近紅外光譜技術(shù)應(yīng)用于白酒酒醅分析的首次開拓性工作。隨后,將近紅外光譜應(yīng)用于酒醅的檢驗(yàn)引起了各酒廠的廣泛研究,汾酒集團(tuán)的郝建國(guó)[5],劍南春酒廠的唐利[6],山東景芝酒業(yè)的曹建全[7],安徽古井貢的楊詩(shī)騰[2],安徽金種子酒業(yè)的林房[8],武漢黃鶴樓酒業(yè)的李良[9],江蘇雙溝酒業(yè)的姜福州[10]等研究者分別使用福斯(foss) InfraXact 型,布魯克MPA 型,瑞士Buchi 型,Thermo Antaris II 型,賽默飛Nicolet Antaris Ⅱ型,Nicolet Antaris Ⅱ型,瑞士Buchi 等近紅外儀器完成了適用于各自酒廠酒醅的近紅外快檢技術(shù)的開發(fā)工作。
縱觀此類報(bào)道,近紅外光譜法在我國(guó)釀酒行業(yè)酒醅分析方面的應(yīng)用,仍然處于起步階段,大多數(shù)的研究仍然還停留于實(shí)驗(yàn)室階段;雖然在各自報(bào)道中,近紅外檢測(cè)酒醅,其所預(yù)測(cè)的理化指標(biāo)精確度都取得了不錯(cuò)的效果,但是考慮到釀酒行業(yè)四季變化、環(huán)境溫濕度變化(尤其是釀酒車間夏季的高溫高濕環(huán)境)、酒醅狀態(tài)變化、酒醅配料調(diào)整,生產(chǎn)工藝改變等外界干擾因素的引入,將近紅外光譜技術(shù)應(yīng)用于實(shí)際生產(chǎn)中,進(jìn)行全生產(chǎn)周期釀酒酒醅的檢測(cè),在當(dāng)前的研究報(bào)道中,增加建模樣品的多樣性及代表性,優(yōu)化算法增加模型準(zhǔn)確性等諸多問(wèn)題仍亟待解決。
本文旨在通過(guò)利用近紅外光譜技術(shù),將過(guò)去近幾年內(nèi)的糟醅近紅外光譜與理化指標(biāo)一一對(duì)應(yīng),利用一階導(dǎo)結(jié)合單位長(zhǎng)度歸一化(nle)等方法對(duì)光譜進(jìn)行預(yù)處理,使用協(xié)同區(qū)間偏最小二乘法(SIPLS)、向后間隔偏最小二乘法(BIPLS)等算法對(duì)光譜波段進(jìn)行優(yōu)化選擇,建立最終的近紅外酒醅快速檢測(cè)模型。此外,通過(guò)模型參數(shù)、后期模型外部盲樣的理化分析數(shù)據(jù)作模型外部驗(yàn)證等方式最終評(píng)定模型的穩(wěn)定性、準(zhǔn)確性及可靠性。最終,以期利用樣本數(shù)量的優(yōu)勢(shì)性,盡可能的涵蓋生產(chǎn)中可能存在的內(nèi)部及外部影響因素,建立一個(gè)覆蓋樣本數(shù)量廣泛,代表性強(qiáng)的酒醅快檢模型,以應(yīng)用于釀酒車間酒醅的酸度、淀粉、水分的快速檢測(cè),為后期釀酒車間向智能化升級(jí)提供技術(shù)支持。
實(shí)驗(yàn)樣品:所用酒醅皆取自于瀘州老窖釀酒車間,按照五點(diǎn)取樣法取樣,盡可能降低樣品的差異性。按照生產(chǎn)工藝的不同,分別從春夏秋冬不同季節(jié)均勻地收集樣本。
實(shí)驗(yàn)儀器及軟件:傅里葉變換近紅外光譜儀(瑞士),光譜范圍為10000~4000 cm-1,分辨率為8 cm-1,掃描次數(shù)為32。光譜采集軟件為NIRWare Opreator(北京中安信達(dá)科技有限公司)、建模軟件為NIRCal(北京中安信達(dá)科技有限公司)、算法選擇為Matlab軟件。
1.2.1 樣品的化學(xué)測(cè)定值分析方法
依據(jù)國(guó)標(biāo)法或企標(biāo)法分別對(duì)每個(gè)樣品進(jìn)行水分、酸度、淀粉指標(biāo)的檢測(cè),其中水分檢測(cè)參考國(guó)標(biāo)GB 5009.3—2016 直接干燥法,酸度檢測(cè)參考國(guó)標(biāo)GB 5009.239—2016,淀粉檢測(cè)參考國(guó)標(biāo)GB 5009.9—2016 酸水解法。
1.2.2 樣品光譜的采集
采用傅里葉變換近紅外光譜儀,InGaAs 控溫檢測(cè)器,以漫反射測(cè)量方式獲取酒醅樣品光譜信息。通過(guò)操作NIRWare Opreator 軟件采集每個(gè)樣品的光譜,每個(gè)樣品重復(fù)測(cè)定3次。
光譜的預(yù)處理、偏最小二乘計(jì)算,SIPLS 算法等程序均在Matlab環(huán)境下運(yùn)行。
1.2.3 模型參數(shù)計(jì)算方法
式中:n——樣本個(gè)數(shù);
YS——樣本的理化分析數(shù)值;
YC——樣本的近紅外預(yù)測(cè)值;
YP——樣本理化分析數(shù)值的平均值。
鑒于近紅外分析屬于間接分析方法,建模樣品光譜質(zhì)量、傳統(tǒng)理化分析精確度、模型優(yōu)化參數(shù)選擇都會(huì)對(duì)近紅外定量分析的準(zhǔn)確度產(chǎn)生較大的影響[11]。除去建模優(yōu)劣的影響外,實(shí)驗(yàn)室分析數(shù)據(jù)的準(zhǔn)確度對(duì)于近紅外模型的準(zhǔn)確度至關(guān)重要,因此,我們對(duì)傳統(tǒng)分析方法檢測(cè)酒醅的數(shù)據(jù)是否滿足建模需求進(jìn)行了驗(yàn)證,選擇酒醅分析中步驟最為繁雜的酒醅淀粉分析為例,選擇5 份出窖酒醅樣品,分別分配于實(shí)驗(yàn)員A、B、C、D、E、F 共6 人,每人做4個(gè)平行試驗(yàn),對(duì)所得的結(jié)果進(jìn)行相對(duì)極差和平均偏差計(jì)算,結(jié)果統(tǒng)計(jì)于表1。
表1 不同人員傳統(tǒng)淀粉檢測(cè)結(jié)果統(tǒng)計(jì)分析
由表1 可知,使用傳統(tǒng)理化分析方法,分析酒醅分析過(guò)程最為復(fù)雜的淀粉,實(shí)驗(yàn)員A、B、C、D、E共5 人均取得了較好的效果,個(gè)人的相對(duì)極差及平均偏差皆滿足要求,這表明傳統(tǒng)的理化分析方法及實(shí)驗(yàn)室操作人員的檢測(cè)水平,皆滿足近紅外建模需求,為建模工作的順利開展奠定良好的基礎(chǔ)。
采集釀酒車間近兩年全部的酒醅出入窖樣品的近紅外光譜,刪除部分未及時(shí)進(jìn)行光譜賦值的數(shù)據(jù),然后將光譜按照Kennard-Stone(K-S)方法將總的光譜樣本分為校正集與驗(yàn)證集。此外,保持適當(dāng)比例同時(shí)期的非建模樣本作為新建模型驗(yàn)證的測(cè)試集。分別按照出窖、入窖類別建立酒醅的酸度、淀粉、水分近紅外快檢模型。
2.2.1 淀粉模型建立
共采集到淀粉已賦值光譜3376 條,其中入窖酒醅光譜1425 條,出窖酒醅光譜1951 條,使用Matlab 進(jìn)行算法選擇對(duì)波段進(jìn)行優(yōu)化,使用建模軟件NIRCal 對(duì)光譜進(jìn)行預(yù)處理并建立模型。使用決定系數(shù)R2及預(yù)測(cè)標(biāo)準(zhǔn)偏差RMSEP 對(duì)模型進(jìn)行評(píng)價(jià),確定模型主成分?jǐn)?shù)(PCs),建立出入窖酒醅快檢模型。
最終,入窖酒醅淀粉模型采用趨近歸一化(ncl)及一階導(dǎo)數(shù)(db1)作為光譜預(yù)處理方法,采用協(xié)同區(qū)間偏最小二乘法(SiPLS 作為)作為波段選擇方法,最終模型選擇波段5504~6400 cm-1、6404~7000 cm-1作為建模波段區(qū)間,以偏最小二乘法(PLS)建立模型,最終模型PCs 為9,RMSEP 為0.4096,決定系數(shù)R2為0.8362。入窖建模樣本其自身理化值及模型預(yù)測(cè)值散點(diǎn)分布圖如圖1。
圖1 入窖酒醅建模樣本淀粉理化值及模型預(yù)測(cè)值散點(diǎn)分布圖
出窖酒醅淀粉模型最終光譜預(yù)處理方法選擇為Segment 5 Gap5 的3點(diǎn)二階泰勒求導(dǎo)(ds2),建模波段選擇為4304~4600 cm-1、5504~6400 cm-1。最終模型PCs 為8,RMSEP 為0.3052,決定系數(shù)R2為0.9192。出窖建模樣本其自身理化值及模型預(yù)測(cè)值散點(diǎn)分布圖如圖2。
2.2.2 水分模型建立
圖2 出窖酒醅建模樣本淀粉理化值及模型預(yù)測(cè)值散點(diǎn)分布圖
共采集水分已賦值光譜2837 條,其中入窖酒醅光譜1049 條,出窖酒醅光譜1788 條。最終入窖酒醅水分模型選擇預(yù)處理方法9 點(diǎn)卷積平滑(sg9)及一階導(dǎo)結(jié)合單位長(zhǎng)度歸一化(nle),建模波段選擇 為4304~4600 cm-1、5504~6100 cm-1、7600~7904 cm-1。最終模型PCs 為7,RMSEP 為0.5871,決定系數(shù)R2為0.8888。入窖建模樣本其自身水分理化值及模型預(yù)測(cè)值散點(diǎn)分布圖如圖3。
圖3 入窖酒醅建模樣本水分理化值及模型預(yù)測(cè)值散點(diǎn)分布圖
出窖酒醅水分模型選擇光譜預(yù)處理方法整點(diǎn)散射校正(mf),建模波段選擇為5504~6100 cm-1、6400~6700 cm-1、7600~7904 cm-1。最終模型PCs為9,RMSEP 為0.4766,決定系數(shù)R2為0.9118。出窖建模樣本其自身水分理化值及模型預(yù)測(cè)值散點(diǎn)分布圖如圖4。
2.2.3 酸度模型建立
圖4 出窖酒醅建模樣本水分理化值及模型預(yù)測(cè)值散點(diǎn)分布圖
采集酸度已賦值光譜4199 條,其中入窖酒醅光譜1732 條,出窖酒醅光譜2467 條。最終入窖酒醅酸度模型選擇光譜預(yù)處理方法為趨近歸一化(ncl)及一階導(dǎo)數(shù)(db1),建模波段選擇為4304~4900 cm-1、5804~6400 cm-1。最終模型PCs 為9,RMSEP 為0.0714,決定系數(shù)R2為0.8776。入窖建模樣本其自身酸度理化值及模型預(yù)測(cè)值散點(diǎn)分布圖如圖5。
圖5 入窖酒醅建模樣本酸度理化值及模型預(yù)測(cè)值散點(diǎn)分布圖
出窖酒醅酸度模型選擇光譜預(yù)處理方法為Segment 5 Gap5 的3 點(diǎn)二階泰勒求導(dǎo)(ds2),建模波段 選 擇 為4300~4600 cm-1、4904~5500 cm-1、5804~6100 cm-1。最終模型PCs 為10,RMSEP 為0.0922,決定系數(shù)R2為0.9427。出窖建模樣本其自身酸度理化值及模型預(yù)測(cè)值散點(diǎn)分布圖如圖6。
2.2.4 模型評(píng)價(jià)
在模型不過(guò)度擬合的前提下,預(yù)測(cè)標(biāo)準(zhǔn)偏差RMSEP 其數(shù)值越低,代表模型的效果越好;R2稱為決定系數(shù),其可以認(rèn)為代表真值與預(yù)測(cè)值的相關(guān)系數(shù)的平方,R2越接近于100,其代表模型預(yù)測(cè)值與理化值越接近。通常在一個(gè)模型中,如果樣品組分的最大值和最小值之間差值越大,決定系數(shù)R2越大[1,6]。
表2 瀘型白酒酒醅近紅外模型相關(guān)信息匯總
圖6 出窖酒醅建模樣本酸度理化值及模型預(yù)測(cè)值散點(diǎn)分布圖
新建立近紅外模型的各相關(guān)信息匯總于表2中,考慮到所建立模型樣本含量基數(shù)大,指標(biāo)理化范圍跨度大,樣本包含外界變化因素多以及理化測(cè)定存在的一定誤差,從目前模型的參數(shù)水平上來(lái)看,總體上來(lái)說(shuō)建立的模型是比較良好、穩(wěn)定的。參考其他酒廠報(bào)道文獻(xiàn)中所建立模型的參數(shù),我們所建立模型也是比較符合行業(yè)目前主流水平的。
除去建模時(shí),選用一定比例的非建模樣品(建模樣品同時(shí)間段樣品)作測(cè)試集,來(lái)評(píng)價(jià)模型預(yù)測(cè)準(zhǔn)確性外,為進(jìn)一步驗(yàn)證所建立模型的預(yù)測(cè)效果,在模型建立完成后的,抽取一定比例的后期近紅外檢測(cè)樣品,作為盲樣,對(duì)模型進(jìn)行外部驗(yàn)證,來(lái)評(píng)判模型的預(yù)測(cè)性能。結(jié)果見圖7。
圖7 淀粉模型預(yù)測(cè)絕對(duì)誤差分布圖
被抽取參與驗(yàn)證的盲樣,對(duì)其模型預(yù)測(cè)值與理化分析值的絕對(duì)誤差進(jìn)行統(tǒng)計(jì)分析。淀粉模型預(yù)測(cè)情況的絕對(duì)誤差分布圖如圖7,其中參與驗(yàn)證的入窖盲樣197 個(gè),出窖116 個(gè)。從圖7 中絕對(duì)誤差分布情況來(lái)看,模型預(yù)測(cè)效果整體是比較可靠的,總體來(lái)說(shuō),出窖模型要優(yōu)于入窖模型,這與模型參數(shù)RMSEP(入窖0.4096,出窖0.3052)所反映的模型預(yù)測(cè)情況是一致的,出窖模型中淀粉預(yù)測(cè)值與理化值絕對(duì)差值<1.5 的樣品占比達(dá)到96.55%,入窖樣品占比達(dá)到87.31%。
水分模型預(yù)測(cè)值與理化值絕對(duì)差值分布圖如圖8,其中參與驗(yàn)證的盲樣,入窖198 個(gè),出窖115個(gè)。總體來(lái)說(shuō),入窖模型與出窖模型預(yù)測(cè)效果相差不大,整體預(yù)測(cè)效果比較可靠穩(wěn)定,模型預(yù)測(cè)值與理化數(shù)值絕對(duì)差值<1.5的樣品占比皆達(dá)到了92%以上。
圖8 水分模型預(yù)測(cè)絕對(duì)誤差分布圖
酸度模型預(yù)測(cè)值與理化值的絕對(duì)差值分布圖如圖9,其中參與驗(yàn)證的盲樣入窖個(gè)數(shù)200,出窖個(gè)數(shù)118。在模型參數(shù)中,入窖RMSEP 值為0.0714 優(yōu)于出窖RMSEP 值0.0922,從模型盲樣驗(yàn)證情況對(duì)比來(lái)看,入窖模型整體預(yù)測(cè)性能也是優(yōu)于出窖模型的,其預(yù)測(cè)絕對(duì)差值<0.3 的樣品占比相較于出窖的92.37%,入窖占比達(dá)到95.50%。
圖9 酸度模型預(yù)測(cè)絕對(duì)誤差分布圖
2.4.1 季節(jié)性的工藝調(diào)整
釀酒生產(chǎn)隨著季節(jié)的變化,往往會(huì)在酒醅配料上進(jìn)行調(diào)整以適應(yīng)外界環(huán)境的變化。以入窖為例,我們?cè)y(tǒng)計(jì)過(guò)不同季度的入窖酒醅其各指標(biāo)理化均值及其最大值與最小值情況,隨著季節(jié)的改變,酒醅的理化數(shù)據(jù)往往會(huì)發(fā)生一定規(guī)律上的變化。一般來(lái)說(shuō),二三季度的酒醅水分均值一般高于一四季度。水分和淀粉作為酒醅理化數(shù)據(jù)中的相對(duì)值,水分占比大,勢(shì)必造成淀粉相對(duì)含量的減少,故二三季度的淀粉均值一般低于一四季度。酸度上二三季度均值總體上高于一四季度??紤]到酒醅指標(biāo)變化的波動(dòng)性,因此建立適用于全年流水線式的近紅外酒醅檢測(cè)模型適用于生產(chǎn),酒醅模型的樣本數(shù)量足夠大,代表性足夠廣泛是極其重要的。
2.4.2 檢測(cè)時(shí)效性的影響
酒醅作為一種釀造過(guò)程中的樣品,其變化因素多,富含多種活性微生物。作為發(fā)酵過(guò)程中的半成品產(chǎn)物,其理化指標(biāo)始終處于一個(gè)動(dòng)態(tài)的變化中。為保證建模精確度,這要求在建模過(guò)程中,需盡可能縮短理化分析與近紅外光譜掃描的時(shí)間間隔,提高酒醅檢測(cè)的時(shí)效性,以降低間隔時(shí)間可能帶來(lái)的精度影響。這也從另外一個(gè)方面說(shuō)明,此類處在動(dòng)態(tài)變化中且屬于反應(yīng)過(guò)程中的產(chǎn)物,其變化因素多,勢(shì)必要求建模樣品多,建模周期長(zhǎng)。
本研究利用近紅外光譜技術(shù)建立了瀘州老窖酒醅快速定量分析模型,所建立模型樣本基數(shù)大,時(shí)間跨度覆蓋整個(gè)釀酒生產(chǎn)周期,理化指標(biāo)范圍足夠覆蓋整個(gè)生產(chǎn)周期樣本各自的情況,總的來(lái)說(shuō)模型比較接近于實(shí)際生產(chǎn)。模型光譜以近紅外漫反射的方式采集,所建立模型中,使用整體散射校正(mf)、趨近歸一化(ncl)等手段對(duì)光譜進(jìn)行了預(yù)處理,對(duì)于特征光譜波段也進(jìn)行了篩選,最終利用偏最小二乘法建立模型。此外,我們利用外部盲樣作為驗(yàn)證,對(duì)模型進(jìn)行了預(yù)測(cè)效果的外部判斷,最終,在允許的檢測(cè)誤差范圍內(nèi),該模型預(yù)測(cè)效果是比較穩(wěn)定可靠的。
近紅外光譜技術(shù)其批量性、快速性的檢測(cè)特點(diǎn)滿足釀酒車間智能化發(fā)展的方向,為釀酒行業(yè)實(shí)現(xiàn)過(guò)程控制,在生產(chǎn)中實(shí)現(xiàn)酒類食品質(zhì)量預(yù)警,提高產(chǎn)品的優(yōu)良率提供了技術(shù)上的支持。