彭厚博,李 麗,吳鍵航,盛旭峰,饒家權,王曉平,邵淑娟,宗緒巖*
(1.四川輕化工大學 釀酒生物技術與應用四川省重點實驗室,四川 宜賓 644002;2.舍得酒業(yè)股份有限公司,四川 遂寧 629609;3.菏澤市行政審批服務局,山東 菏澤 274032;4.菏澤市食品藥品檢驗檢測研究院,山東 菏澤 274032)
白酒是一種中國所特有的蒸餾酒,具有鮮明的習慣、民族及地域特征。其中以高粱、玉米等谷物為釀酒原料,以小麥(有的用麩曲和產(chǎn)脂酵母)制作的偏高溫大曲為糖化發(fā)酵劑的濃香型白酒,是我國白酒中的一朵奇葩[1]。濃香型白酒具有酒窖香濃郁、香味協(xié)調、柔軟甘洌、尾凈余長[2]。白酒因為不同品牌而具有不同的風味,甚至相同酒廠不同酒齡、不同呈香強弱的酒都具有不同的風味,但是白酒中決定其風味和品質的卻是2%左右的酯、酸、醇等物質,甚至還有一些沒有被研究發(fā)現(xiàn)的呈香、呈味物質,這就造成了深入研究的困難[3]。隨著化學計量學和各種檢測儀器的不斷完善,對信息的深入挖掘和分析,可為濃香型白的快速、準確的分類鑒別提供理論依據(jù)和方法[4]。
隨著現(xiàn)代快速分析儀器技術的發(fā)展,近紅外光譜技術、拉曼光譜技術、氣相色譜質譜聯(lián)用(gas chromatography-mass spectrometer,GC-MS)技術、電子舌技術、電子鼻技術也廣泛的運用于白酒分析領域[5]。劉建學等[6]研究表明,傅里葉變換近紅外光譜對白酒基酒中的乙醛、乙醛酸有特異吸收,預測集和驗證集的決定系數(shù)(R2)分別達到0.942 9、0.918 6;馬凱升[7]利用傅里葉光譜結合移動窗口主成分判別分析(move wavenumber-principal component analysis-discriminantfactor analysis,MW-PCA-LDA)和移動窗口偏最小二乘判別分析(move wavenumber-partial least squares-discriminant factor analysis,MW-PLS-DA)對白酒品牌進行了高精度的判別分析;趙國鵬等[8]研究表明,拉曼光譜儀對白酒真?zhèn)魏桶拙圃a(chǎn)地追溯具有很高的現(xiàn)實意義;胡雪等[9]通過GC-MS結合化學計量學對濃香型白酒的品牌進行了區(qū)分和鑒別,發(fā)現(xiàn)GC-MS能夠對不同品牌的濃香型白酒進行鑒別。
由于對快速和無損檢測技術的需求,感官仿生技術迅速的發(fā)展起來[10]。近年來,迅猛發(fā)展的電子舌技術被廣泛的運用于各種食品的感官評價研究。電子舌儀器是一種模仿人類和動物舌頭的新型儀器,用于分析、識別和檢測復雜的香氣和風味成分,模仿人的味覺器官,通過味覺傳感器陣列獲取待測樣品的信息,通過多元統(tǒng)計分析方法對得到的數(shù)據(jù)信號進行降維處理,實現(xiàn)對待測樣品快速、準確的分析[11-12]。劉鑫等[13]使用電子舌建立了基于深度學習的化學計量學方法對白酒品牌進行了分類;門洪等[14]采用支持向量機結合MQ、MP型氣體傳感器的電子鼻和電子舌融合系統(tǒng)區(qū)分白酒基酒的類型;孫文佳等[15]研究表明,電子舌對同一產(chǎn)地不同品牌的豉香型白酒具有很好的分類,并且味覺雷達圖表明線性判別分析法明顯優(yōu)于主成分分析。
本研究使用電子舌儀器,對每個不同年份的白酒基酒樣品重復進行3次檢測,采用主成分分析(principal component analysis,PCA)、線性判別分析(linear discriminant analysis,LDA)和簇狀獨立軟模式法(soft independent modeling of class analogy,SMICA)、判別因子分析(discriminant factor analysis,DFA)對樣品的年份進行分類和識別,以期為白酒行業(yè)提供一種快速、穩(wěn)定、準確的白酒基酒年份分析技術。
本研究選用81瓶不同年份同一酒廠(舍得酒業(yè)股份有限公司)的白酒基酒樣品作為檢測集,其中2016年的白酒基酒樣品21瓶,2017年份的白酒基酒樣品17瓶,2018年的白酒基酒樣品12瓶,2019年的白酒基酒樣品9瓶,2020年的白酒基酒樣品22瓶,酒精度在66.4%vol~73.5%vol之間;選取2014年~2021年各2個基酒樣品共16個樣品作為驗證集;氯化鉀(分析純):四川西隴科學有限公司。
SmarTongue電子舌:上海瑞玢國際貿(mào)易有限公司,其中包括:SmarTongue電子舌主機、SmarTongue自動進樣器、SmarTongue樣品瓶清洗器、SmarTongue電子舌專用燒杯、SmarTongue電子舌專用樣品瓶架:美國ISENSO公司。
1.3.1 試劑配制
清洗溶液:稱取0.745 g氯化鉀,用超純水定容至1 L,混勻,靜置1 d后備用。
1.3.2 儀器方法
使用電子舌系統(tǒng)對酒樣進行數(shù)據(jù)采集,每個樣品取20 mL分別進行電子舌檢測,其中傳感器陣列分為鉑、銀、鎢、鈦、鈀、金6個電極,首先使用0.01 mol/L的氯化鉀溶液對傳感器進行預熱,預熱30 min,預熱完傳感器之后用蒸餾水清洗一遍傳感器,然后設置電子舌的檢測參數(shù)最低電壓-1 V、最大電壓1 V,脈沖間隔200,靈敏度10-4,設置好后開始測試樣品。每個樣品重復測試3次,每次測試90 s,不同樣品之間用蒸餾水清洗傳感器,得到電子舌原始數(shù)據(jù)。
1.3.3 數(shù)據(jù)處理
首先使用MATLAB 2019b 對降維的電子舌數(shù)據(jù)進行處理,對數(shù)據(jù)進行主成分分析(PCA)、線性判別分析(LDA),使白酒基酒年份得到區(qū)分;然后使用電子舌智能感官分析專家(ISENSO)將PCA、LDA建模得到的模型分別導入簇狀獨立軟模式法(SMICA)和判別因子分析(DFA)中進行分析,使白酒年份得到很好的區(qū)分。使用MATLAB 2019b和Origin 2018繪制獲得的數(shù)據(jù)。
由于原始數(shù)據(jù)過多,需要將原始數(shù)據(jù)進行降維處理(見圖1),以方便后續(xù)的建模分析。
圖1 電子舌分析降維數(shù)據(jù)結果Fig.1 Results of dimension reduction data by electronic tongue analyse
PCA是一種常用的無監(jiān)督化學計量學分析方法,以多個變量通過線性變換的形式選出2個或3個變量去代表全體變量的一種多元統(tǒng)計方法,用于降低數(shù)據(jù)的維度,可以很好的識別樣本之間的差異[16-17]。對樣品滋味物質電子舌分析結果進行PCA,列出了前十個主成分的方差貢獻率,結果見圖2。
由圖2可知,橫坐標是10個主成分數(shù),縱坐標是其方差貢獻率,第一成分和第二成分的方差貢獻率分別為59.4%和14.5%,前2個成分的方差貢獻率和為73%,大于70%,可以代表樣品大多數(shù)的信息。
圖2 各主成分的方差貢獻率Fig.2 Variance contribution rate of each principal component
散點圖中每個點表示一個樣品的一次檢測,每個點之間的距離表示檢測次數(shù)之間的差異大小,主要表示樣品之間的區(qū)分,其顏色線圈表示相對應年份樣品95%的置信區(qū)間[18]。由主成分PC1、PC2構建二維散點圖,結果見圖3。由圖3可知,5個不同年份的濃香型基酒能得到較好的分類。2016年的基酒把2017年~2020年的基酒囊括在內,表明2016年的基酒能夠表示2017年~2020年的信息;2017年將2018年和2019年的基酒囊括在內,卻與2020年的基酒聚類距離較遠,表明2017年的基酒可以表示2018、2019年的基酒信息,不能代表2020年的基酒信息;2018年、2019年和2020年的基酒聚類距離相對較遠,表明之間可以得到很好的區(qū)分。綜上所述,2016年的基酒與2017年~2020年的基酒之間滋味存在很多相似性,2017年的基酒與2018年和2019年的基酒滋味也存在相似性,但是2017年的基酒卻與2020年的基酒滋味存在較大差異,2018年、2019年和2020年份的基酒之間的滋味差異較大。
圖3 不同年份酒樣滋味物質主成分分析散點圖Fig.3 Scatter diagram of taste compounds in Baijiu samples with different years
SMICA分析是多元統(tǒng)計分析中最常用的一個數(shù)據(jù)分析與挖掘的方法,該方法利用物以類聚的原則對樣品進行區(qū)分。首先對某一類樣品進行PCA分析,建立PCA回歸模型構成標準數(shù)據(jù)庫,之后根據(jù)該模型對未知的樣品進行識別,即勘探該未知樣品與標準數(shù)據(jù)庫進行擬合,確定未知樣品屬于同一類或者不同一類,常用于真?zhèn)螛悠返淖R別鑒定[19]。主要是通過PCA分析構建的模型進行識別分析,來提供最佳的數(shù)據(jù)處理的方法。模外數(shù)據(jù)SMICA結果見圖4,模內數(shù)據(jù)SMICA結果見圖5。
圖4 模外數(shù)據(jù)簇狀獨立軟模式法分析結果Fig.4 Analysis results of out-of-mode data by soft independent modeling of class analogy method
圖5 模內數(shù)據(jù)簇狀獨立軟模式法分析結果Fig.5 Analysis results of in-mode data by soft independent modeling of class analogy method
由圖4可知,垂直線和水平線顯示的都是95%的置信區(qū)間。將2014年、2015年、2021年每年2個基酒酒樣共計6個酒樣導入模型進行分析,發(fā)現(xiàn)6個酒樣都聚類在一起,并且集中在左上角區(qū)域,得到的輸出結果都是NO,表明輸入的6個酒樣都不屬于模型以內,即輸入的6個酒樣的年份都不在2016年~2020年,和預期的完全一致,說明該模型能夠很好地區(qū)分模型2016~2020年份之外的酒樣。
由圖5可知,將2016年~2020年2個基酒酒樣共計10個酒樣導入模型,發(fā)現(xiàn)10個酒樣都聚類在圖的左下角,得到的結果都是YES,判斷結果與已知結果100%吻合,表明這10個酒樣的年份都是模型以內的,即這10個酒樣的年份在2016年~2020年以內,該模型能夠很好的識別2016~2020年模型之內的基酒樣品。綜上所述,可以得出該模型穩(wěn)定性、可靠性、重復性都很好,可以很好的區(qū)分不同年份的基酒酒樣,可以用于提高酒廠的工作效率,促進白酒行業(yè)的健康快速發(fā)展[20]。
線性判別分析是一種有監(jiān)督的數(shù)據(jù)降維方法。是將同類型的高維數(shù)據(jù)投影后,將同類型的高維數(shù)據(jù)聚類到低維空間,而不同類別之間相距較遠的一種分析方法[21]。本試驗將降維的電子舌數(shù)據(jù)進行LDA分析。結果見圖6。
圖6 不同年份酒樣線性判別分析散點圖Fig.6 Scatter diagram of Baijiu samples with different years by linear discriminant analysis
由圖6可知,不同年份的基酒酒樣之間的聚類距離較遠,相同年份的基酒酒樣之間可以得到很好的聚類,表明6個不同年份的基酒酒樣可以得到很好的區(qū)分,電子舌對于不同年份的基酒樣品可以進行較好的區(qū)分識別,且相同年份的基酒樣品都很好的落在了相同的區(qū)域,且重疊較好。電子舌LDA分析對于不同年份基酒差異性檢測的靈敏度很高,且具有較強的實用性[22]。
判別因子分析是通過已有的樣品數(shù)據(jù)建立的數(shù)據(jù)庫對未知的樣品數(shù)據(jù)進行定性分析判別的一種統(tǒng)計學分析方法。其原理是對原始數(shù)據(jù)進行線性變換,使同一組樣品間距最大的縮小,不同組樣品間距最大的擴大,使得樣品可以很好的得到區(qū)分[23]。DFA算法可以對多個樣品種類進行區(qū)分和識別,常常用于不同等級的區(qū)分和產(chǎn)地的鑒別[24]。模外數(shù)據(jù)的DFA數(shù)據(jù)結果見圖7。
圖7 模外數(shù)據(jù)判別因子分析結果Fig.7 Results of out-of-mode data by discriminant factor analysis
由圖7可知,將2014年、2015年、2021年各2個基酒酒樣共計6個酒樣導入模型進行分析,結果表明,明顯的發(fā)現(xiàn)該6個基酒酒樣不屬于LDA模型任何一個區(qū)間,2014年與2015年的基酒樣品集中在右上角,2021年的基酒酒樣在圖左下角,說明該模型不僅可以很好的區(qū)分模型之外的年份基酒,而且為之后將更多的年份基酒導入模型,增加模型的預測范圍與穩(wěn)定性提供了依據(jù)[25]。
本實驗將基酒樣品G1、G2、G3、G4、G5分別作為五個等級,將2016年~2020年這5年分別各2個基酒樣品共10個樣品作為未知樣品,來預測樣品分別屬于哪一個等級,結果見圖8。由圖8可知將2016年~2020年各2個基酒酒樣導入模型,結果表明,不同的年份的基酒酒樣能夠準確的落入相應的年份范圍里面,而且相同年份的基酒酒樣得到了很好的聚類,說明該LDA模型不僅可以準確的區(qū)分模型以外不同年份的基酒酒樣,還可以準確的識別模型以內的不同年份的基酒酒樣,對白酒的年份實現(xiàn)了分級[26]。
圖8 模型數(shù)據(jù)判別因子分析區(qū)分圖Fig.8 Differentiation diagram of model data by discriminant factor analysis
本實驗采用多傳感陣列的電子舌系統(tǒng)對81個白酒基酒酒樣進行了年份的區(qū)分,使用主成分分析(PCA)和線性判別分析(LDA)建立了一個準確、穩(wěn)定、快速的模型,通過多元變量統(tǒng)計分析(SMICA)和判別因子分析(DFA)對模型進行評價。實驗研究表明,SMICA分析的結果能夠準確的識別導入的樣品數(shù)據(jù)是否是模型以內和模型之外的年份基酒,而DFA分析可以準確的對導入的白酒樣品的年份進行識別,確定其白酒樣品的年份。本研究采用電子舌技術對白酒基酒年份建立了快速穩(wěn)定的分析方法,克服了傳統(tǒng)檢測方法費時費力的缺點,實驗結果很好,為白酒行業(yè)提供了一種快速、準確、穩(wěn)定的分析方法,為快速推動白酒產(chǎn)業(yè)和白酒分析技術的發(fā)展提供助力。