陳明舉,周 迪,王 鴻,熊興中
(1.四川輕化工大學 人工智能四川省重點實驗室,四川 宜賓 644000;2.四川輕化工大學 自動化與信息工程學院,四川 宜賓 644000)
白酒主要是以糧食谷物為主要釀造原材料,其釀造工藝及成分紛繁復雜,在相同的原材料、發(fā)酵劑和發(fā)酵環(huán)境,白酒的香型、口感和質量也可能會存在差異。目前,白酒的特性主要是通過品酒師的感官器官對白酒進行色、香、味進行的評價[1]。由于感官分辨的精度有限、評價指標不一致等因素,使得白酒品質難以界定、等級難以分辨。建立一個科學、有效的白酒質量評價方法與客觀標準是當前研究的熱點問題[2]。
一些學者將圖譜技術應用到白酒的特性的識別研究中,建立一些基于圖譜技術的白酒分類與識別方法,如氣相色譜法[3]、液相色譜法[4]、氣質聯(lián)用(gas chromatographymass spectrometer,GC-MS)[5]、紅外光譜法[6]、電子鼻[7]、核磁共振法[8]等方法。在眾多的白酒圖譜識別技術中,氣相色譜-質譜聯(lián)用儀綜合了色譜法的分離能力和質譜的定性能力,可在較短的時間內(nèi)對多組分混合物進行定性分析,從而有效地體現(xiàn)微量組成成分[9]。GC-MS圖譜技術在白酒分類識別中獲得較好的性能,栗新峰等[10]將GC-MS色譜技術應用于濃香型白酒基酒質量等級評價,建立一個白酒基酒等級分類模型;張丹丹等[11]利用GC-MS分析不同白酒中的微量組分,實現(xiàn)對白酒特性的更深層次分析與識別。錢宇等[12]對市售暢銷的7個品牌、不同等級的濃香型白酒為研究對象,利用主成分(principal component analysis,PCA)降維GC-MS圖譜數(shù)據(jù),實現(xiàn)不同品牌、不同產(chǎn)地白酒的分類。
當前,基于GC-MS的白酒圖譜數(shù)據(jù)主要采用PCA降維處理,實現(xiàn)圖譜數(shù)據(jù)的主要特征的提取[14]。PCA通過幾個正交主成分來表示白酒圖譜數(shù)據(jù)的完整信息,在數(shù)據(jù)信息最大限度保留的基礎上,達到數(shù)據(jù)降維的目的[16-17]。近年來,隨著稀疏表示理論的完善,稀疏表示技術逐步應用于白酒圖譜的識別中[18]。為了更好地實現(xiàn)數(shù)據(jù)的稀疏分解,并體現(xiàn)各組分的權重,將稀疏性與PCA相結合使用,建立稀疏主成分分析(sparse principal component analysis,SPCA)。SPCA運用聚集數(shù)據(jù)稀疏性的方法來區(qū)別主成分,實現(xiàn)每個主成分所對應的單位特征向量能夠讓盡可能多的零來填充代替,實現(xiàn)用更少的變量線性組合來表示原始數(shù)據(jù),從而更好地實現(xiàn)數(shù)據(jù)降維分析[19]。SPCA已應用于機械故障的診斷[20]、人臉圖像[21-22]以及股票分析[23]等行業(yè)中。
鑒于此,本研究將SPCA應用于白酒GC-MS圖譜分析中,建立基于SPCA與GC-MS的濃香型白酒評判模型,并通過實驗驗證該方法的有效性[24]。首先采用氣相色譜-質譜聯(lián)用儀對濃香型白酒中的46種微量成分進行定量測試[25],采用SPCA對白酒進行降維分析,獲得白酒GC-MS圖譜數(shù)據(jù)的稀疏主成分,最后結合感官評價結果,通過回歸分析建立濃香型白酒等級評價模型,從而實現(xiàn)對濃香型白酒的客觀評判[26]。
1.1.1 白酒樣品
濃香型白酒樣品:選取川南地區(qū)濃香型白酒樣品,白酒經(jīng)過感官評定后,選取特級(編號為T1、T2、T3、T4、T5)、優(yōu)級(編號為S1、S2、S3、S4、S5)、一級(編號為Y1、Y2、Y3、Y4、Y5)、二級(編號為R1、R2、R3、R4、R5)四個等級的白酒各5個,共20個酒樣。
1.1.2 化學試劑
C7~C40正構烷烴標準品(均為色譜純):北京曼哈格生物科技有限公司;無水乙醇(純度99.5%):上海阿拉丁生化科技股份有限公司;甲醇(純度99.9%):上海阿達瑪斯試劑有限公司。
TIC-6800型氣相色譜-質譜聯(lián)用儀:江蘇天瑞儀器股份有限公司;DB-WAXMS 色譜柱(30 m×0.25 mm×0.25 μm):安捷倫科技(中國)有限公司。
1.3.1 白酒中揮發(fā)性風味成分的GC-MS分析
白酒中揮發(fā)性風味成分的檢測采用GC-MS法[10]。GC條件:采用DB-WAXMS 色譜柱(30 m×0.25 mm×0.25 μm)。進樣量為1 μL,分流比為20∶1,進樣口溫度為250 ℃;載氣為高純氦氣(He),流速1mL/min;初始溫度40℃,然后以10℃/min升溫到120 ℃,120 ℃時的保留時間為2 min;再以10 ℃/min升溫到200 ℃,保留時間為2 min[12];最后以10 ℃/min升溫到250 ℃,250 ℃時的保留時間為2 min。MS條件:接口溫度:280 ℃;電離方式為電子電離(electronic ionization,EI)源,電子能量70 eV;離子源溫度230 ℃;掃描質量范圍29~500 m/z。
風味物質定性分析:對酒樣進行GC-MS分析,利用美國國家標準與技術研究院(national institute of standards and technology,NIST)12數(shù)據(jù)庫及相對保留時間指數(shù)對白酒中的風味成分進行定性分析。相對保留時間指數(shù):將C7~C40的正構烷烴標準品與酒樣相同實驗條件下進行分析,根據(jù)各正構烷烴的保留時間計算相應的保留時間指數(shù)(retention index,RI),其計算公式如下:
式中:RIx表示待測組分的保留指數(shù);T(i)表示待測組分的保留時間,min;n和n+1分別表示正構烷烴的碳原子個數(shù),個。
樣品測定及定量分析:準確量取5 mL白酒樣品,加入體積分數(shù)為60%的乙醇溶液配制的3種混合內(nèi)標溶液100 μL(乙酸正戊酯15.10 g/L、叔戊醇15.19 g/L、2-乙基丁酸15.09 g/L),混勻后自動上機進行GC-MS檢測。實驗中分別利用乙酸正戊酯、叔戊醇和2-乙基丁酸計算酒樣中酯類、醇類和酸類及其他風味物質的校正因子含量。參考國標GB/T 10345—2007《白酒分析方法》中的內(nèi)標法,根據(jù)內(nèi)標峰面積計算各風味成分的含量。
1.3.2 白酒樣品的感官評價及分級
濃香型白酒感官評價參考國家標準GB/T 10345—2007《白酒分析方法》[29]進行。感官評價人員組成是由川南區(qū)域品酒員組成。采用編號順位暗評品評法對白酒進行評價,按照色、香、味、格分別為5分、25分、60分、10分的評分配比進行綜合評定,總分為100分,對各品酒師所打分求平均值,即為該白酒品評得分。其中得分93.0~100.0分為特級,88.0~92.9分為優(yōu)級,80.0~87.9分為一級,70.0~79.9分為二級,70.0分以下為其他。
1.3.3 基于SPCA白酒質量評價模型的建立
SPCA運用聚集數(shù)據(jù)稀疏性降維實現(xiàn)圖譜數(shù)據(jù)的主成分提取,與PCA相比,SPCA每個主成分所對應更少原始圖譜數(shù)據(jù),更好地體現(xiàn)白酒微量與白酒品質的相關性[30-31]。采用稀疏主成分分析方法來搭建一個基于不同等級的濃香型白酒的質量評判模型,將更能體現(xiàn)白酒微量成分與白酒特性的關系。本研究將通過對白酒中微量成分進行SPCA降維處理,建立綜合指標因子,并與感官評價相結合,尋求更科學、客觀與準確的濃香型白酒的評價模型。整個評價模型建立方法如下:
(1)圖譜數(shù)據(jù)的初始化與標定
對于第i個樣本的GC-MS圖譜的積分峰面積向量記為Xi,構建n(n=46)個白酒樣品的積分峰面積矩陣X={X1,X3,X3,……Xn},其對應白酒品質等級主觀評分的數(shù)據(jù)集為U={u1,u2,u3,……un}(ui范圍0~100)。
(2)SPCA分解與綜合指標的確定
分別計算積分峰面積矩陣的前m個主成分(這里m=10),以及前m個主成分所對應的特征向量,從而分別得到特征向量矩陣A=(α1,α2,…αm)。
對于給定的積分峰面積矩陣X的特征向量矩陣A=(α1,α2,…αm),計算基于彈性網(wǎng)懲罰結構的稀疏主成分問題:
得到積分峰面積的稀疏主成分向量D=(d1,d2,…dm)=與稀疏主成分方差貢獻率向量R=(R1,R2,…,Rm)。
積分峰面積的稀疏主成分可以通過稀疏主成分向量與圖譜積分峰面積線性組合得到:
通過最大峰值數(shù)據(jù)構建的白酒特性的綜合指標G,G為稀疏主成分Fj與貢獻率Rj的乘積之和。
(3)感官分值的數(shù)學模型的建立
以綜合指標G作為自變量,把感官評分產(chǎn)生的分值U作為因變量進行回歸分析處理,建立的白酒的感官分值的數(shù)學模型U=f(G)。
采用上述氣相色譜測試條件對濃香型白酒樣品中的揮發(fā)性風味成分進行測定,代表白酒樣品的揮發(fā)性風味成分GC-MS分析的總離子流色譜圖見圖1,各化合物含量見表1。
圖1 濃香型白酒代表樣品揮發(fā)性風味成分GC-MS分析總離子流色譜圖Fig.1 Total ion chromatogram of volatile flavour compounds in representative strong-flavor Baijiu sample analysis by GC-MS
表1 濃香型白酒代表樣品揮發(fā)性風味成分GC-MS分析結果Table 1 GC-MS analysis results of volatile flavour compounds in representative strong-flavor Baijiu sample
由表1可知,共篩選得到46種共有化合物,酯類18種,醇類10種,醛酮類7種,酸類9種,苯類2種。酒樣中含量較高的風味物質主要為酯類,其中乙酸乙酯、乙酸丙酯、丁酸乙酯、亞油酸乙酯、正己酸乙酯、乳酸乙酯、己酸乙酯、己酸、十八酸乙酯和異丁酸乙酯明顯高于其它風味物質。
20個濃香型白酒樣品感官品評分見表2。由表2可知,選取的特級、優(yōu)級、一級與二級四個等級的樣品酒各5個,其評分值在70~100分之間均勻分布,這有利于提取代表白酒等級特性的主成分信息,以便建立準確的客觀評價模型。
表2 20個白酒樣品的感官品評結果Table 2 Results of sensory evaluation of 20 Baijiu samples
對20個白酒中的46種揮發(fā)性風味成分物質構成20×46矩陣采用稀疏主成分的方法進行因子分析[32],剔除成分矩陣中特征值小于1的成分中特征向量對應的變量,然后重新進行因子分析,結果保留了30個能夠代表白酒區(qū)分等級的成分。通過凱撒正態(tài)化最大方差法進行旋轉[33],再利用SPCA處理,得到前10個稀疏主成分特征值、方差貢獻率和累計方差貢獻率見表3。
表3 10個稀疏主成分的特征值、方差貢獻率和累計方差貢獻率Table 3 Eigenvalues,variance contribution rates and cumulative variance contribution rates of 10 sparse principal components
由表3可知,前7個稀疏主成分的累計方差貢獻率達到93.579%,即前7個主成分能夠代表白酒數(shù)據(jù)中93.579%的白酒信息特性。前7個稀疏主成分向量矩陣如表4所示。通過表4可得到前7個主成分F1,F(xiàn)2,F(xiàn)3,F(xiàn)4,F(xiàn)5,F(xiàn)6,F(xiàn)7的標準線性組合關系如公式(5)所示,其中X1,X2,X3,……X30為30個共有峰的峰面積,構建的白酒成分特性的綜合指標G為稀疏主成分與貢獻率的乘積之和(公式6)。
表4 前7個稀疏主成分向量矩陣Table 4 Vector matrix of first seven sparse principal components
其中,F(xiàn)的系數(shù)為對應的累計方差貢獻率,X的系數(shù)為系數(shù)主成分微量成分值。
將綜合指標G與各個白酒的感官評分U結合分析,如表5所示。從表5對特級、優(yōu)級、一級、二級四級表述可以看出,綜合指標G在數(shù)值上與感官評分結果基本一致,由此可見,綜合指標G越大,感官評分的綜合得分就會越高,質量等級就會越好。
表5 20個樣本的綜合指標值Table 5 Comprehensive index values of 20 samples
以綜合指標G作為自變量,感官評分U作為因變量進行回歸分析處理,依次對白酒數(shù)據(jù)作對數(shù)回歸、線性回歸、二次方回歸、三次方回歸四種回歸分析方法,所產(chǎn)生數(shù)據(jù)的回歸分析結果如圖2所示,感官評分分數(shù)與綜合指標的回歸分析關鍵見表6所示。
圖2 回歸分析結果Fig.2 Results of regression analysis
表6 感官評分分數(shù)與綜合指標間的回歸分析Table 6 Regression analysis between sensory score and comprehensive index
比較表6中四種不同的回歸分析方法得到的相關系數(shù)R2可知,三次回歸分析擬合度高達99.3%,能準確反應酒樣中綜合指標G與感官評分分值U之間的關系。因此,本研究建立的基于SPCA與GC-MS的濃香型白酒評價模型為:
另選用的20個白酒樣本,采用本文建立的白酒評價模型(公式5)進行模型驗證,得到20個白酒樣本客觀評分結果與感官評分對比結果見表7所示,模型驗證結果見表8。
由表7可知,客觀評判模型評價的結果與感官評分雖然存在差異,但差值的絕對誤差小于3,兩者的鑒定結果基本一致。由表8可知,采用本文模型等級評價結果與感官評分結果相符率達到94%。因此,本文建立的基于SPCA與GC-MS白酒質量評價模型能夠準確性實現(xiàn)白酒等級的評判,具有較強的實際應用價值。
表7 等級評價模型評分結果Table 7 Score results of grade evaluation model
表8 模型驗證結果Table 8 Validation results of model
本研究以濃香型白酒為研究對象,利用GC-MS圖譜分析技術對白酒的微量成分進行有效的檢測,采用SPCA數(shù)據(jù)處理與回歸分析方法建立白酒質量評價模型。利用建立的白酒質量評價模型對白酒質量進行客觀評分,在實現(xiàn)特級、一級、二級、優(yōu)級四級白酒的等級評判中,準確率達到94%??梢姳狙芯拷⒌幕贕C-MS與SPCA技術的白酒質量評價模型具有較好的學術參考與實際應用價值。另外,由于樣品酒有限,加之樣品標注的信息不全,本研究僅對白酒的質量等級進行研究,未對白酒年代、產(chǎn)地、品牌以及價格等特性進行研究,下一步工作將GC-MS與SPCA技術應用于白酒年代、產(chǎn)地、品牌等其它特性研究中,并建立相應的判別模型。