• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于GC-IMS的白酒特征分析及鑒別

    2023-02-17 03:30:08魯祥凱賀金娜樊保民孫嘯濤
    中國食品學(xué)報(bào) 2023年1期
    關(guān)鍵詞:判別函數(shù)正確率白酒

    魯祥凱,楊 彪*,孫 瑩,賀金娜,樊保民,孫 輝,孫嘯濤

    (1 北京工商大學(xué)化學(xué)與材料工程學(xué)院 北京 100048 2 江蘇今世緣酒業(yè)股份有限公司 江蘇淮安 223411 3 山東海能科學(xué)儀器有限公司 山東德州 253000 4 北京工商大學(xué)輕工科學(xué)技術(shù)學(xué)院 北京 100048)

    白酒中豐富的微量組分及獨(dú)特的風(fēng)味,來源于釀酒原料的差異以及發(fā)酵過程中微生物群落的多樣性和特異性[1]。白酒的人工品評(píng)鑒別是基于對(duì)組分的非定性、非量化的感官判斷,判別標(biāo)準(zhǔn)因人而異[2-3]。 白酒的儀器鑒別主要通過來自原料和發(fā)酵產(chǎn)物的差異性特征組分信息來進(jìn)行判別。 自1964年初次采用層析法定性白酒中的一些微量成分以來,已發(fā)展出光譜、色譜結(jié)合質(zhì)譜以及傳感器等儀器分析方法,結(jié)合模式識(shí)別可對(duì)白酒的香型、等級(jí)、年份以及產(chǎn)地進(jìn)行鑒別[4-10]。

    根據(jù)微量無機(jī)元素或同位素含量等反映釀酒原料特征的信息可較為準(zhǔn)確地鑒別白酒[11-14]。姜濤等[15]檢測黔、川兩地白酒中15 個(gè)特征元素,根據(jù)其中6 種元素(Mn、Ga、Sc、V、Na 和Cs)含量建立了兩種判別模型,對(duì)兩地白酒的產(chǎn)地鑒別正確率分別為94.7%和100%。 李清亮等[11]依據(jù)12 種無機(jī)元素聚類分析結(jié)果,成功將12 個(gè)品牌共175 份白酒樣品的分為4 類。 然而,生產(chǎn)批次、儲(chǔ)存時(shí)間以及糧源變化會(huì)導(dǎo)致信息的不穩(wěn)定,因此該類方法僅作參考。

    通過對(duì)白酒中某些組分的定性、 定量分析或者采集特定范圍內(nèi)的光譜也可鑒別白酒[16-21]?;舻と旱萚22]采用氣相色譜分析技術(shù),定性、定量分析7種不同產(chǎn)地白酒中的10 種組分,通過主成分分析建立的判別模型對(duì)未知酒樣鑒別正確率為93.9%。 徐睿等[23]通過多種處理方法對(duì)8 種白酒(金沙藍(lán)鉆酒和其它白酒) 的近紅外光譜進(jìn)行處理,最終以4 119.20~9 881.46 cm-1區(qū)間的光譜特征建立金沙藍(lán)鉆酒相似度匹配模型,鑒別正確率達(dá)100%。白酒中某些物質(zhì)與傳感器的特異性響應(yīng)也可用于白酒的鑒別[24-28]。Li 等[29]使用電子鼻結(jié)合多維尺度支持向量機(jī)算法實(shí)現(xiàn)對(duì)10 個(gè)品牌白酒98.3%的正確鑒別。 田婷等[30]采用電子鼻結(jié)合主成分分析實(shí)現(xiàn)對(duì)醬香型白酒分類識(shí)別。然而,傳感器主要是針對(duì)白酒中特定物質(zhì)種類進(jìn)行響應(yīng),無法做到全方位分析,有時(shí)還受到酒精的影響[10]。 上述常用的白酒儀器鑒別方法沿襲了白酒風(fēng)味分析的原理,需對(duì)白酒中確定的風(fēng)味組分進(jìn)行定性、定量或半定量檢測分析,進(jìn)而提取特征建立鑒別模型,存在局限性。目前,尚未建立類似人工品評(píng)的儀器方法,可以在未定性具體組分情況下,僅依據(jù)組分宏觀差異來鑒別白酒。

    近年來,氣相色譜-離子遷移譜法(GC-IMS)憑借高分離效率、 高靈敏度以及響應(yīng)速度快的優(yōu)勢(shì)逐漸成為檢測分析揮發(fā)性有機(jī)物的有效方法[31-33]。GC-IMS 檢測獲取的風(fēng)味特征指紋圖譜,不僅能可視化分析微量組分差異,還能提取主要特征并建立鑒別模型。 Chen 等[34]依據(jù)指紋圖譜區(qū)分3 個(gè)產(chǎn)地共122 個(gè)黃酒樣品,建立二次判別模型,對(duì)訓(xùn)練集產(chǎn)地分類正確率為97.47%,預(yù)測集正確率為95.35%。 Zhou 等[35]從不同年份的白云邊陳釀酒的特征風(fēng)味指紋圖譜中選取60 個(gè)特征,結(jié)合主成分分析可將3年和5年陳釀完全區(qū)分,而15年和20年陳釀因過于相似而無法完全區(qū)分。

    本文將2 種香型(含2 種酒精度)的10 種白酒直接頂空制樣進(jìn)行GC-IMS 分析,獲得指紋圖譜,在未定性、定量前提下,通過指紋圖譜中各微量組分相對(duì)含量提取白酒特征,建立Fisher 線性判別模型,以實(shí)現(xiàn)對(duì)不同香型、酒精度以及不同檔次白酒的準(zhǔn)確鑒別。

    1 材料與方法

    1.1 材料與主要儀器

    白酒樣品取自江蘇某酒企。 選取42 度和52度共10 種不同檔次和香型的白酒,為確保樣品的代表性,每種白酒分別取2 個(gè)不同勾調(diào)批次的樣品。 白酒樣品采用A-B-C 代碼表示,其中A 代表酒精度,B 代表酒樣序號(hào),C 代表勾調(diào)批次。 如:42-1-2 表示42 度白酒1 號(hào)第2 個(gè)勾調(diào)批次樣品。42 度白酒的1~5 號(hào)樣品為濃香型,6 號(hào)為清雅醬香型;52 度白酒中1~3 號(hào)樣品為濃香型,4 號(hào)為清雅醬香型。

    氣相色譜-離子遷移譜儀(FlavourSpec 1 H1-100053),德國GAS 公司,配套美國Restek 公司Rtx-Wax 色譜柱(30 m×0.53 mm,1 μm)以及瑞士CTC 公司自動(dòng)頂空進(jìn)樣裝置(Combi PAL)。

    1.2 測試方法

    樣品于室溫下密封避光儲(chǔ)存。 測試時(shí)采用頂空制樣并對(duì)制樣條件進(jìn)行優(yōu)化。 優(yōu)化后的頂空制樣條件為:取原始白酒樣品0.5 mL 置于20 mL 頂空瓶中密封,70 ℃加熱振蕩孵化15 min,由頂空瓶上部空間取樣200 μL 用于檢測,頂空進(jìn)樣針溫度為85 ℃。

    設(shè)定GC-IMS 測試條件:氣相色譜柱溫度60℃,漂移管溫度45 ℃。 氣相色譜載氣流速:0~2 min:2 mL/min;2~10 min:2~10 mL/min;10~30 min:10~90 mL/min;30~40 min:90 mL/min。 離子遷移譜漂移氣恒定流速150 mL/min。 載氣和漂移氣均為氮?dú)猓兌?9.999%)。 每個(gè)白酒樣品重復(fù)測3次。

    2 結(jié)果與分析

    2.1 白酒揮發(fā)組分分析

    從白酒樣品中共檢測到水和乙醇之外的134種揮發(fā)組分(含二聚體),見表1。 由已有數(shù)據(jù)庫可定性其中65 種物質(zhì),其余69 種為未定物。

    表1 白酒中檢測到的揮發(fā)組分Table 1 Volatile substances in Baijiu

    (續(xù)表1)

    (續(xù)表1)

    (續(xù)表1)

    將所有揮發(fā)性組分信號(hào)峰提取后形成指紋圖譜(圖1)。 其中,每個(gè)點(diǎn)代表一種物質(zhì),顏色越紅表示物質(zhì)濃度越高。 橫軸為樣品中檢測到的所有揮發(fā)組分,縱軸為同一揮發(fā)組分在不同白酒樣品中的濃度差異。由圖1 可以發(fā)現(xiàn),雖然酒精度和香型不同,但是指紋圖譜中部藍(lán)色區(qū)域內(nèi)的組分為白酒的共有特征組分。 清雅醬香型白酒42-6 和52-4 的圖譜類似,且與其它香型白酒圖譜差異明顯。指紋圖譜左側(cè)黃色區(qū)域內(nèi)的大部分組分,在清雅醬香型白酒中的濃度要明顯低于濃香型白酒,而譜圖中綠色及右側(cè)黃色區(qū)域中2-甲基丁酸乙酯、乙酸葉醇酯、乙酸異戊酯、2-己醇、糠醛等組分在清雅醬香型白酒中的濃度則明顯高于濃香型白酒。這反映出白酒香型不同導(dǎo)致的組分差異。作為低端產(chǎn)品的42-2 和52-1 濃香型白酒,在圖譜兩側(cè)黃色區(qū)域中的組分濃度明顯低于其它濃香型白酒。另外,每種白酒平行測試3 次的結(jié)果無明顯差異,說明GC-IMS 法的穩(wěn)定性很好。 除42-3 和52-1 兩種白酒的批次之間有較明顯差異外,其它白酒的批次差異不明顯,說明其勾調(diào)批次穩(wěn)定性較好。以上簡單分析可知,指紋圖譜能夠清晰直觀地反映白酒樣品中微量揮發(fā)組分的含量差異以及白酒勾調(diào)批次的穩(wěn)定性。

    圖1 白酒樣品揮發(fā)物質(zhì)指紋圖譜Fig.1 Fingerprints of volatile substances in Baijiu samples

    根據(jù)GC-IMS 測試數(shù)據(jù)計(jì)算得到10 種白酒樣品的平均歐氏距離(表2)。 歐氏距離越大,兩樣品間差異越大,反之則相似度越高。結(jié)合指紋圖譜分析可知,每個(gè)樣品平行檢測3 次的結(jié)果十分穩(wěn)定,歐氏距離均小于0.65(表2 中粗體數(shù)據(jù))。同一樣品批次之間的差異(表2 中灰色陰影數(shù)據(jù)),除樣品42-3 和樣品52-1 的批次差異較明顯(歐式距離分別為1.680 和1.554)外,其它樣品批次差異均小于1。 因此,歐氏距離也可直觀反映白酒生產(chǎn)過程中的勾調(diào)穩(wěn)定性。 由表2 數(shù)據(jù)可知,樣品42-1、42-3、42-4 和42-5 較為相似,42-2 與52-2較為相似,52-2 與52-3 較為相似,42-6 與52-4較為相似,與可視化的指紋圖譜結(jié)論一致。 綜上,采用GC-IMS 檢測白酒中揮發(fā)組分,不僅結(jié)果穩(wěn)定性好,還能反映不同批次間的質(zhì)量穩(wěn)定性,可直接應(yīng)用于白酒生產(chǎn)過程中的質(zhì)量監(jiān)控。

    表2 白酒樣品間平均歐氏距離Table 2 The average Euclidean distance between Baijiu samples

    2.2 白酒鑒別模型

    建立白酒的鑒別模型前,首先需要獲取白酒的主要特征,常用的方法有特征選擇和特征提取兩種。兩種方法均是對(duì)原有特征的降維處理,區(qū)別在于是否改變特征的屬性。 特征選擇從原始特征中篩選子集,未改變其屬性。主要是從準(zhǔn)確性和特征維數(shù)考慮,根據(jù)相關(guān)程度或其它角度從原始數(shù)據(jù)中篩選,形成具有較高正確率的特征子集[36-37]。特征提取則是對(duì)原始特征進(jìn)行數(shù)學(xué)變換,通過線性組合(如主成分分析)形成相互獨(dú)立的新特征,有效地解決“維數(shù)災(zāi)難”[38]。

    本文基于頂空制樣所測得的60 組數(shù)據(jù),在兼顧樣品品質(zhì)和香型的前提下隨機(jī)取樣,消除類別屬性,從中劃分出20 個(gè)獨(dú)立樣本,作為測試集,剩余樣本作為訓(xùn)練集。 分別依據(jù)相關(guān)性分析和主成分分析對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行主要特征提取,然后建立Fisher 線性判別模型并進(jìn)行交叉驗(yàn)證,最后對(duì)測試集樣品進(jìn)行判別驗(yàn)證。

    2.2.1 特征選擇(相關(guān)性分析) 顯而易見,濃度差異顯著的組分對(duì)白酒的鑒別意義更大。 需要通過相關(guān)性分析,對(duì)原始數(shù)據(jù)進(jìn)行特征篩選,獲得白酒的鑒別特征。 本文對(duì)所有組分特征進(jìn)行皮爾遜雙尾相關(guān)性檢測,保留與組變量相關(guān)性系數(shù)α≥0.4 且顯著相關(guān)(P<0.05)的變量,篩除相關(guān)性弱以及相對(duì)冗余的變量,最終提取出39 個(gè)特征組分變量。 相關(guān)性分析部分見表3。 由表3 可知,白酒類別相關(guān)性較大的39 個(gè)組分變量在0.01 水平相關(guān)性顯著,具有統(tǒng)計(jì)學(xué)意義。 其中有20 個(gè)組分為正相關(guān)變量,依據(jù)相關(guān)性排序?yàn)槲炊ㄎ?9(0.752)、未定物59(0.629)、未定物3(0.609)、2-乙?;拎海?.608)、未定物10(0.553)、未定物8(0.535)、乙酸葉醇酯(0.533)、未定物7(0.523)、未定物9(0.482)、乳酸乙酯(0.469)、丙酸(0.464)、未定物58(0.464)、未定物12(0.447)、2-己醇(0.446)、未定物5(0.437)、2,3-二甲基-1,3-丁二烯(0.430)、3-甲基-3-丁烯-1-醇(0.427)、乙酸異戊酯(0.411)、未定物4(0.409)、正戊醇(0.407);另外19 個(gè)組分為負(fù)相關(guān)變量,依據(jù)相關(guān)性排序?yàn)橐宜嵝刘ィ∕)(0.754)、未定物53(0.690)、異丁酸乙酯(0.606)、辛酸乙酯(M)(0.583)、癸酸乙酯(0.583)、未定物19 (0.569)、2,4,5-三甲基噻唑(0.553)、未定物60(0.545)、50(0.490)、26(0.477)、36(0.472)、31(0.462)、65(0.445)、5-甲基-3-庚酮(0.439)、未定物69(0.428)、68(0.425)、33(0.420)、丁酸戊酯(0.417)、未定物64(0.414)。通過相關(guān)性分析可知,白酒樣品間的差異主要來源于更微量的組分(非主體風(fēng)味物質(zhì)),而不是相對(duì)含量更高的物質(zhì)(主體風(fēng)味物質(zhì))。

    表3 白酒特征相關(guān)性分析(部分)Table 3 Correlation analysis of Baijiu characteristics (part)

    2.2.2 特征提?。ㄖ鞒煞址治觯?主成分分析可將原始特征變換成新的特征向量,且能夠保證相互之間正交。為分析各特征對(duì)白酒組分的貢獻(xiàn),本文采用最大正交旋轉(zhuǎn)變換,使每個(gè)變量中解釋的因子量最少。以特征值大于1 為閾值,共選取6 個(gè)主成分,相關(guān)矩陣特征值見表4。 6 個(gè)主成分可以反映原特征信息的92.648%,基本保留了原始特征,具有合理性。

    表4 相關(guān)矩陣特征值Table 4 Eigen values of the correlation matrix

    以表1 中各物質(zhì)順序依次分別記作變量X1、X2、X3……X134,通過主成分分析獲得原始變量與各主成分之間的相關(guān)程度,見表5。 通過主成分分析獲得6 個(gè)相互獨(dú)立的綜合指標(biāo)模型:

    表5 原始變量與各主成分之間相關(guān)程度Table 5 Correlation between original variables and principal components

    PC1 = 0.970 X11+ 0.948 X5+ 0.944 X3+……-0.376 X114,可反映原數(shù)據(jù)標(biāo)準(zhǔn)變異的53.530%,代表變量為未定物8、丙酸、正戊醇等;

    PC2=0.046 X11+……+0.961 X107+0.951 X112+……+ 0.372 X114,可反映原數(shù)據(jù)標(biāo)準(zhǔn)變異的19.987%,代表變量為丁酸戊酯、未定物65、癸酸乙酯等;

    PC3 = - 0.040 X11+……+ 0.910 X88+ 0.846X108+……+0.448 X114,可反映原數(shù)據(jù)標(biāo)準(zhǔn)變異的7.136%,代表變量為5-甲基-3-庚酮、未定物64、未定物33 等;

    PC4=-0.136 X11+……+0.920 X29+0.654 X47+……-0.376 X114,可反映原數(shù)據(jù)標(biāo)準(zhǔn)變異的6.000%,代表變量為異丁酸乙酯、未定物26 等;

    PC5 = 0.137 X11- 0.126 X5+ 0.131 X3+……+0.058 X114,可反映原數(shù)據(jù)標(biāo)準(zhǔn)變異的3.397%;

    PC6=-0.067 X11-0.141 X5-0.012 X3+……+0.518 X114,可反映原數(shù)據(jù)標(biāo)準(zhǔn)變異的2.598%。

    (續(xù)表5)

    計(jì)算各主成分得分,以PC1、PC2 和PC3 為坐標(biāo)軸,繪制主成分三維得分圖(圖2),可以對(duì)白酒進(jìn)行分類。 42-6 和52-4 為清雅醬香型白酒,聚類區(qū)域與其它濃香型白酒相距較遠(yuǎn),且這兩種酒之間區(qū)分較為明顯。 濃香型白酒相距較近,除了42-3 和52-1 批次差異較大,導(dǎo)致同類酒樣本分散外,其它酒聚類范圍均較小,然而,也發(fā)現(xiàn)42-1 和42-5 相距十分近。 由此可知,基于主成分分析的分類方法能夠反映白酒風(fēng)味的相似性與典型性。

    圖2 白酒樣品主成分三維得分圖Fig.2 Three-dimensional score map of principal components in Baijiu samples

    2.2.3 Fisher 線性判別模型 Fisher 線性判別是典則判別中常用的一種方法,主要是將高維空間內(nèi)樣本坐標(biāo)投影至低維空間內(nèi)進(jìn)行分類,投影原則是同類差異最小化,異類差異最大化,分類完成后獲得每類的組質(zhì)心坐標(biāo),對(duì)未知樣本進(jìn)行鑒別時(shí)同樣采用就近原則進(jìn)行判別[39]。 本文分別將全部134 個(gè)組分特征數(shù)據(jù),根據(jù)相關(guān)性篩選出的39個(gè)組分特征數(shù)據(jù)以及特征提取的6 個(gè)主成分作為Fisher 線性判別分析的數(shù)據(jù)集,分別建立白酒的Fisher 線性判別模型。 這3 個(gè)模型對(duì)訓(xùn)練樣本的分類正確率均為100%,而交叉驗(yàn)證分類正確率依次為17.5%,67.5%和90%。 說明對(duì)原始數(shù)據(jù)進(jìn)行特征提取,可有效提高模型鑒別正確率,然而同時(shí)也發(fā)現(xiàn)模型缺乏優(yōu)化,效果較差。本文結(jié)合逐步回歸分析對(duì)判別模型引入的特征進(jìn)一步優(yōu)化。 其基本思路是將變量依次選入,當(dāng)其對(duì)因變量影響顯著時(shí)保留,不顯著則移除,繼續(xù)引入新的變量,若被移除的變量在新變量引入后變得重要時(shí),則重新被引入[40]。 通過不斷擬合,直至達(dá)到鑒別效果最優(yōu)的模型。 本文中條件設(shè)置為:F 概率P 值選入和移除閾值分別為0.05 和0.1。

    將全部134 個(gè)特征數(shù)據(jù)采用逐步回歸分析擬合26 次,獲得最優(yōu)模型,記作M1。 M1 采用24 個(gè)主要組分特征,分別為未定物8、9、17、20、22、29、31、47、51、53、56、59、65,乙酸乙酯、2,5-二甲基呋喃、丙酸乙酯、2-甲基丁酸甲酯、2-己酮、異戊醇、乙酸戊脂、正辛醛、乳酸乙酯、正己醇和2-壬酮。Wilk's Lambda 檢驗(yàn)結(jié)果P=0.000,說明該模型具有統(tǒng)計(jì)學(xué)意義。取9 個(gè)判別函數(shù),其特征值分別為207474.591,7530.331,1512.763,374.611,337.366,49.578,45.563,34.382 和7.277,分別能夠解釋模型方差變化的95.449%,3.464%,0.696%,0.172%,0.155%,0.023%,0.021%,0.016%和0.003%。 前2個(gè)Fisher 線性判別函數(shù)總共可解釋98.913%的方差變化,包含了主要的信息,可描述各特征的差異與聯(lián)系。 以前2 個(gè)Fisher 線性判別函數(shù)作散點(diǎn)圖(圖3)。 圖3 中10 種白酒彼此分隔,同種白酒聚斂程度十分好,基本以組質(zhì)心為中心聚攏,且測試集的白酒樣品基本分布于各組質(zhì)心附近。 該模型對(duì)訓(xùn)練集鑒別正確率達(dá)100%,采用留一法交叉驗(yàn)證正確率也為100%。所建立模型的Fisher 線性判別函數(shù)的系數(shù)見表6,各組質(zhì)心見表7。

    表7 模型M1 中各組質(zhì)心坐標(biāo)Table 7 The centroid coordinates of each group in model M1

    圖3 模型M1 的Fisher 線性判別函數(shù)散點(diǎn)圖Fig.3 The scatter plot of Fisher's linear discriminant function for model M1

    表6 模型M1 的Fisher 線性判別函數(shù)系數(shù)Table 6 Fisher's linear discriminant function coefficient for model M1

    (續(xù)表6)

    根據(jù)表6 中系數(shù)建立模型判別函數(shù):

    F1= 0.285 X11+ 0.368 X12-0.007 X22+……+0.035 X117-1651.784

    F2= -0.106X11+ 0.285 X12+ 0.064X22+……+0.015 X117-261.285

    F3= 0.015 X11- 0.033 X12+ 0.025 X22+……-0.002 X117-257.640

    F4=-0.034 X11+0.242 X12+0.031 X22+……+0.008 X117-310.737

    F5= 0.056 X11+ 0.037 X12- 0.012X22+……+0.008 X117-178.647

    F6= 0.028 X11+ 0.078 X12- 0.006X22+……+0.007 X117-84.080

    F7= 0.030 X11+ 0.092 X12+ 0.005X22+……+0.004 X117-123.979

    F8=-0.064 X11+0.021 X12+0.013 X22+……+0.004 X117+4.373

    F9= 0.002 X12+ 0.004 X22- 0.001 X23+……+0.001 X117+24.801

    根據(jù)Fisher 線性判別函數(shù)F1~F9,將未知酒樣(測試集)的24 個(gè)特征數(shù)據(jù)代入函數(shù)中,計(jì)算函數(shù)值,即為樣本坐標(biāo),然后分別計(jì)算與10 個(gè)組質(zhì)心的距離,將其鑒別為最近距離的組(G1~G10)。 對(duì)測試集酒樣鑒別正確率達(dá)100%,鑒別結(jié)果見表8。

    表8 測試集酒樣與模型M1 中各組質(zhì)心距離以及鑒別結(jié)果Table 8 The distance between samples in test set and centroids of each group and identification results in model M1

    將經(jīng)相關(guān)性分析篩選出的39 個(gè)特征采用逐步回歸分析擬合21 次,獲得最優(yōu)模型M2。 M2 中采用21 個(gè)主要特征,分別為未定物3、5、8、9、10、12、19、33、36、50、53、58、65、69,2,3-二甲基-1,3-丁二烯、 乙酸異戊酯、2-己醇、5-甲基-3-庚酮、2,4,5-三甲基噻唑、 丙酸和癸酸乙酯。 Wilk's Lambda 檢驗(yàn)結(jié)果P=0.000,說明該模型具有統(tǒng)計(jì)學(xué)意義。 取9 個(gè)判別函數(shù),其特征值分別為8 927.756,1 063.998,269.675,75.069,54.977,19.170,15.420,3.956 和2.795,分別能夠解釋模型方差變化的85.574%,10.199%,2.585%,0.720%,0.527%,0.184%,0.148%,0.038%和0.027%。 前2個(gè)Fisher 線性判別函數(shù)共可解釋95.772%的方差變化,包含了主要的信息,并可描述各特征的差異與聯(lián)系。 以前兩個(gè)Fisher 線性判別函數(shù)作散點(diǎn)圖(圖4)。 圖4 中,10 種白酒彼此分隔,同種白酒聚斂十分好,基本以組質(zhì)心為中心聚攏。與圖3 不同的是,圖4 中測試集中未知酒樣的分布相對(duì)混亂,可以預(yù)見其對(duì)未知酒樣鑒別正確率會(huì)降低。 該模型對(duì)訓(xùn)練集鑒別正確率達(dá)100%,采用留一法交叉驗(yàn)證正確率為100%。所建立的模型Fisher 線性判別函數(shù)系數(shù)見表9,各組質(zhì)心見表10。根據(jù)9 個(gè)判別函數(shù)計(jì)算出的訓(xùn)練集未知酒樣坐標(biāo)并鑒別,其結(jié)果見表11。 采用21 個(gè)主要特征建立的判別模型對(duì)未知酒樣鑒別正確率為95%,只有52-4 被錯(cuò)誤預(yù)測為42-6。

    表9 模型M2 的Fisher 線性判別函數(shù)系數(shù)Table 9 Fisher's linear discriminant function coefficient for model M2

    表10 模型M2 中各組質(zhì)心坐標(biāo)Table 10 The centroid coordinates of each group in model M2

    表11 未知酒樣與模型M2 中各組質(zhì)心距離以及鑒別結(jié)果Table 11 The distance between unknown samples and centroids of each group and identification results in model M2

    圖4 模型M2 的Fisher 線性判別函數(shù)散點(diǎn)圖Fig.4 The scatter plot of Fisher's linear discriminant function for model M2

    (續(xù)表10)

    根據(jù)表9 中系數(shù)建立模型判別函數(shù):

    F1= 0.369 X3- 0.055 X5+ 0.553 X8+……+0.007 X134-331.721

    F2= 0.011 X3- 0.038 X5+ 0.040 X8+……-0.007 X134-191.563

    F3= 0.015 X3+ 0.008 X5-0.127 X8+……-0.004 X130+113.399

    F4= 0.047 X3- 0.011 X5- 0.095 X8+……+0.008 X134-76.098

    F5= 0.042 X3+ 0.010 X5-0.047 X8+……+0.004 X134-62.262

    F6= 0.052 X3- 0.024 X5- 0.101 X8+……+0.002 X134+9.224

    F7= 0.005 X3- 0.011 X5-0.083 X8+……-0.003 X134- 171.638

    F8= 0.034 X3- 0.016 X5 + 0.063 X8+……-0.004 X134-72.314

    F9= - 0.004 X3+ 0.007 X5-0.021 X8+……+0.001 X134- 14.944

    此外,采用主成分分析得到的6 個(gè)主分量作為建模數(shù)據(jù),逐步回歸分析擬合結(jié)果與直接輸入結(jié)果一致,對(duì)訓(xùn)練集和驗(yàn)證集分類正確率分別為100%和90%,對(duì)測試集中未知酒樣的鑒別正確率為95%。

    本文選取的白酒樣本既有香型導(dǎo)致的組分差異,也有勾調(diào)批次的差異,具有體系的復(fù)雜性。 因此相關(guān)性特征選擇和主成分分析提取的特征建立的Fisher 線性判別模型,對(duì)測試集樣品的留一法交叉驗(yàn)證正確率未達(dá)到100%。以逐步回歸分析從全部特征中提取未定物8、2,5-二甲基呋喃和丙酸乙酯等24 個(gè)主要特征建立的Fisher 線性判別模型,其訓(xùn)練集、驗(yàn)證集和測試集分類正確率均為100%;根據(jù)相關(guān)性篩選出的39 個(gè)組分特征數(shù)據(jù),經(jīng)逐步回歸分析優(yōu)化為未定物3、2,3-二甲基-1,3-丁二烯和乙酸異戊酯等21 個(gè)主要特征建立模型,其訓(xùn)練集、驗(yàn)證集和測試集分類正確率分別為100%,100%和95%;以6 個(gè)主分量建立的鑒別模型,對(duì)訓(xùn)練集、驗(yàn)證集和測試集分類正確率分別為100%,90%和95%。 以上結(jié)果表明,采用逐步回歸分析對(duì)判別模型中的主要特征進(jìn)行優(yōu)化,全部組分特征中經(jīng)逐步回歸篩選出24 個(gè)特征建立的Fisher 判別模型對(duì)白酒樣品的鑒別效果最佳,其性能上優(yōu)于預(yù)先進(jìn)行特征提取建立的模型。

    3 結(jié)論

    白酒不經(jīng)預(yù)處理,直接頂空制樣進(jìn)行GCIMS 分析,所得指紋圖譜能夠直觀反映白酒樣品間的相似性與組分差異,以及勾調(diào)批次的穩(wěn)定性。通過逐步回歸分析提取主要特征可以明顯改善Fisher 判別模型的性能。 以全部134 個(gè)揮發(fā)組分結(jié)合逐步回歸分析擬合,提取出24 個(gè)主要組分建立的Fisher 線性判別模型性能最佳,對(duì)訓(xùn)練集分類正確率為100%。采用留一法交叉驗(yàn)證分類正確率也為100%,相比于直接Fisher 線性判別建模正確率提升了82.5%,對(duì)測試集中未知酒樣的鑒別正確率也達(dá)到100%。

    GC-IMS 方法無需對(duì)微量組分進(jìn)行定性及定量,依據(jù)各物質(zhì)相對(duì)含量即可提取白酒的主要特征,并建立模型實(shí)現(xiàn)白酒的準(zhǔn)確鑒別。 GC-IMS 檢測方法簡便易操作,可為白酒生產(chǎn)過程中質(zhì)量控制、市場監(jiān)管及白酒原產(chǎn)地保護(hù)提供技術(shù)支持,為不同地域、 香型以及不同年份的白酒分類鑒別提供參考。

    猜你喜歡
    判別函數(shù)正確率白酒
    門診分診服務(wù)態(tài)度與正確率對(duì)護(hù)患關(guān)系的影響
    游樂設(shè)施事故與危險(xiǎn)量化判別函數(shù)的構(gòu)建
    推動(dòng)白酒行業(yè)生產(chǎn)方式升級(jí)(二)
    探究上市公司財(cái)務(wù)預(yù)警的數(shù)學(xué)模型
    生意
    品管圈活動(dòng)在提高介入手術(shù)安全核查正確率中的應(yīng)用
    太白酒
    生意
    一起自制白酒引起甲醇食物中毒的調(diào)查報(bào)告
    西藏科技(2015年6期)2015-09-26 12:12:09
    基于Fisher判別函數(shù)的酒店員工離職預(yù)警研究
    乐东| 图们市| 云龙县| 曲水县| 华容县| 肥城市| 揭东县| 蓬安县| 城步| 磐石市| 鹤壁市| 南澳县| 嘉禾县| 鄢陵县| 平陆县| 平潭县| 民权县| 巨鹿县| 五原县| 仪征市| 卢氏县| 衡水市| 津南区| 佛学| 九龙城区| 托克逊县| 巨鹿县| 汤原县| 乡宁县| 出国| 遵义县| 凉山| 会同县| 行唐县| 潞西市| 河南省| 门源| 蒲城县| 绩溪县| 额敏县| 延津县|