鄭繼明,鄭亞麗,黃 濤,湯文杰
(1.重慶郵電大學(xué)數(shù)理學(xué)院,重慶400065;2.重慶郵電大學(xué)通信與信息工程學(xué)院,重慶400065)
葡萄酒的質(zhì)量是葡萄酒中各種成分協(xié)調(diào)平衡的結(jié)果,然而葡萄酒的成分之間卻存在著復(fù)雜的關(guān)系。如何運(yùn)用科學(xué)的方法使這些復(fù)雜關(guān)系簡(jiǎn)單化,進(jìn)而能更加準(zhǔn)確地進(jìn)行葡萄酒質(zhì)量的評(píng)價(jià),已成為一個(gè)研究熱點(diǎn)。目前國(guó)內(nèi)對(duì)葡萄酒質(zhì)量的研究主要傾向于對(duì)葡萄酒理化指標(biāo)的分析,采用的方法主要有統(tǒng)計(jì)分析[1,2]和感官評(píng)價(jià)[3]等。以2012年“高教社杯”全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽A題[4]中提供的數(shù)據(jù)為基礎(chǔ),通過(guò)建立基于主成分分析和曲面擬合的數(shù)學(xué)模型,研究如何由葡萄酒的理化指標(biāo)分析評(píng)價(jià)葡萄酒質(zhì)量問(wèn)題。
由于數(shù)據(jù)類型比較多且比較繁雜,建模的第一步就是要對(duì)這些數(shù)據(jù)進(jìn)行處理,以降低模型求解過(guò)程中的難度??紤]到各個(gè)理化指標(biāo)的單位不一致,并且有數(shù)據(jù)存在缺失和異常現(xiàn)象,首先對(duì)缺失和異常的數(shù)據(jù)進(jìn)行剔除處理,然后對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使分析結(jié)果更加準(zhǔn)確可信。
針對(duì)已知27種紅葡萄酒對(duì)應(yīng)的7個(gè)理化指標(biāo)含量,以及賽題附件1[4]中兩組評(píng)酒員的評(píng)價(jià)結(jié)果,給出如下假設(shè):
(1)A組評(píng)酒師的評(píng)分結(jié)果更加可信,將A組評(píng)酒師的評(píng)分作為27種葡萄酒的專家打分;
(2)葡萄酒的質(zhì)量由專家打分?jǐn)?shù)據(jù)(總分)確定;
(3)葡萄酒的理化指標(biāo)只考慮賽題附件2[4]中給出的指標(biāo)。
在處理多元樣本數(shù)據(jù)時(shí),首先遇到的問(wèn)題是觀測(cè)數(shù)據(jù)很多。如果多個(gè)指標(biāo)是相互獨(dú)立的,則可以把問(wèn)題化為n個(gè)單指標(biāo)來(lái)處理。主成分分析[5]是采取一種數(shù)學(xué)降維的方法,它是將多指標(biāo)化為少數(shù)幾個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)分析方法。選取與葡萄酒質(zhì)量相關(guān)聯(lián)的7項(xiàng)指標(biāo),即分別將花色苷(X1),單寧(X2),總酚(X3),酒總黃酮(X4),白藜蘆醇(X5),DPPH半抑制體積(X6),色澤(X7)作為指標(biāo)體系,并將其綜合指標(biāo)分別記為z1,z2,…,zm(m≤7),可建立如下數(shù)學(xué)模型:
其中主成分系數(shù)lij由下列原則來(lái)決定:
① zi與 zj(i≠j;i,j=1,2,…,m)相互無(wú)關(guān);
② z1是X1,…,X7的一切線性組合中方差最大者;z2是與z1不相關(guān)的X1,…,X7的所有線性組合中方差最大者;……;zm是與z1,z2,…,zm都不相關(guān)的X1,X2,…,X7的所有線性組合中方差最大者;
這樣決定的新變量指標(biāo)z1,z2,…,zm分別稱為原變量指標(biāo)X1,X2,…,X7的第一,第二,…,第m主成分。其中,z1在總方差中占的比例最大,z2,z3,…,z7的方差依次遞減。通過(guò)挑選前幾個(gè)最大的主成分,既減少了變量的數(shù)目,又抓住了主要矛盾,簡(jiǎn)化了變量之間的關(guān)系。
模型(1)的求解步驟如下:
①對(duì)原始數(shù)據(jù)Xij進(jìn)行標(biāo)準(zhǔn)化處理。主成分分析首先要消除樣本數(shù)據(jù)中各變量不同量綱的影響,即令:
②計(jì)算相關(guān)系數(shù)矩陣R:
其中rij(i,j=1,2,…,7)為原變量 Xi與 Xj的相關(guān)系數(shù),其計(jì)算公式為
代入具體數(shù)據(jù)[4],通過(guò)運(yùn)用matlab求解得到相關(guān)系數(shù)矩陣R,以及矩陣R的特征值λi和特征向量ei。
③計(jì)算主成分貢獻(xiàn)率及累積貢獻(xiàn)率。主成分zi的貢獻(xiàn)率為
由步驟①、②和③,以及問(wèn)題所給數(shù)據(jù),可得計(jì)算結(jié)果如表1。
表1 主成分貢獻(xiàn)率及累積貢獻(xiàn)率
表2 載荷矩陣
由表1可知,前2個(gè)主成分的累積貢獻(xiàn)率已達(dá)到90.7%,大于85%,基本上保留了原來(lái)指標(biāo)X1,X2,…,X7的主要信息,因此選取這2個(gè)主成分已足夠。這樣便將原來(lái)的7個(gè)指標(biāo)轉(zhuǎn)化為2個(gè)新指標(biāo),達(dá)到了簡(jiǎn)化分析的目的。
④ 計(jì)算主成分載荷p(zk,Xi):
其中p(zk,Xi)表示第k個(gè)主成分zk與第i個(gè)原變量指標(biāo)Xi的因子載荷,eki為特征值λk對(duì)應(yīng)的標(biāo)準(zhǔn)化后的特征向量的第i個(gè)分量。通過(guò)正交旋轉(zhuǎn)后的主成分載荷矩陣如表2所示。
由表2可以看出,第一主成分和 X1,X2,X3,X4,X6均負(fù)相關(guān),且相關(guān)系數(shù)很大(相關(guān)系數(shù)的絕對(duì)值>0.8),和X7有較大的正相關(guān)(相關(guān)系數(shù)為0.867),可以說(shuō)第一主成分反映的是葡萄酒的酚類物質(zhì)及其相關(guān)化合物,可以顯著影響葡萄酒的外觀、滋味、口感、香氣以及微生物穩(wěn)定性。同時(shí)由表2可以看出第一主成分與總酚(X3)的相關(guān)性最強(qiáng),故將總酚作為第一主成分的代表。第2主成分和X5有較大的正相關(guān)(相關(guān)系數(shù)為0.839),和其他變量的相關(guān)系數(shù)均較小,因此可以認(rèn)為第2主成分集中反映葡萄酒的保健功能,以白藜蘆醇的含量為代表。
⑤結(jié)果驗(yàn)證。由以上分析可以得出葡萄酒的7個(gè)理化指標(biāo)可以被歸納為2類,其代表分別為總酚和白藜蘆醇。結(jié)果與文獻(xiàn)[6]和文獻(xiàn)[7]一致,表明對(duì)理化指標(biāo)的歸類是合理的。
為了進(jìn)一步得出葡萄酒指標(biāo)和葡萄酒質(zhì)量間具體的函數(shù)表達(dá)式,采用曲面擬合的方法求解,并同時(shí)計(jì)算出優(yōu)質(zhì)葡萄酒其主要理化指標(biāo)應(yīng)滿足的條件。
首先要確定每種葡萄酒的得分,將A組10名評(píng)酒員對(duì)27種紅葡萄酒的評(píng)分去掉一個(gè)最高分和一個(gè)最低分后,取其平均值作為每種葡萄酒最后的專家評(píng)分。然后將紅葡萄酒的兩個(gè)主要指標(biāo):總酚和白藜蘆醇的含量作為自變量x,y,紅葡萄酒的專家評(píng)分作為因變量f,對(duì)這27個(gè)點(diǎn)進(jìn)行二次曲面的最小二乘擬合。
在實(shí)際擬合時(shí),主要借助matlab中的sftool工具箱。首先輸入紅葡萄酒27個(gè)樣本各自的總酚和白藜蘆醇的含量x,y及專家評(píng)分f;然后確定擬合方式,即綜合考慮x,y,f 3個(gè)變量之間的物理關(guān)系,同時(shí)結(jié)合各種擬合方式下的誤差平方和(SSM),方程的確定系數(shù)(R-square)及均方根誤差(RMSE)的參數(shù),采用二元二次多項(xiàng)式擬合。最后經(jīng)檢驗(yàn),SSM=260.3,R-square=0.37,RMSE=3.52,說(shuō)明擬合可以很好地解釋該曲面方程。圖1是使用matlab對(duì)27個(gè)樣本值進(jìn)行曲面擬合的三維仿真結(jié)果。
根據(jù)仿真結(jié)果,可得到專家評(píng)分與葡萄酒理化指標(biāo)的經(jīng)驗(yàn)公式為:
圖1 葡萄酒質(zhì)量和理化指標(biāo)間的三維仿真
其中,葡萄酒的總酚含量x和白藜蘆醇含量y的單位為mmol/L。
根據(jù)專家評(píng)分,定義評(píng)分大于70分的紅葡萄酒為優(yōu)質(zhì)酒品,即令:
則滿足式(8)中的x,y的取值范圍即為獲得優(yōu)質(zhì)酒品的條件。在三維仿真圖上,可以通過(guò)作一個(gè)f=70平面與曲面方程(8)相交,可得一個(gè)閉合曲線l,那么在f=70平面以上的部分都可以認(rèn)為屬于優(yōu)質(zhì)酒品。通過(guò)求解相交曲線的邊界點(diǎn)即可確定 x,y的取值范圍。由文獻(xiàn)[8]可知,紅葡萄酒中總酚含量最大不超過(guò)2 347 mg/L,即x<13.04 mmol/L;紅葡萄酒中白藜蘆醇含量最大不超過(guò)16.7 mg/L。于是優(yōu)質(zhì)葡萄酒對(duì)應(yīng)的葡萄酒理化指標(biāo)應(yīng)該滿足的要求為:總酚含量5.6 mmol/L<x<13.04 mmol/L,同時(shí)白藜蘆醇含量6.4 mg/L<y<16.7 mg/L。
運(yùn)用主成分分析法提取了葡萄酒的主要理化指標(biāo),又通過(guò)曲面擬合得出了葡萄酒質(zhì)量和葡萄酒理化指標(biāo)的關(guān)系,使得可以通過(guò)分析釀酒葡萄的理化指標(biāo)來(lái)評(píng)價(jià)葡萄酒的質(zhì)量,對(duì)葡萄酒質(zhì)量評(píng)價(jià)具有一定的應(yīng)用價(jià)值。在未來(lái)的研究當(dāng)中,將重點(diǎn)分析葡萄酒各理化指標(biāo)的含量測(cè)定以及怎樣改良葡萄酒質(zhì)量的問(wèn)題,以期對(duì)實(shí)際的生產(chǎn)生活起到一定的指導(dǎo)意義。
[1]李運(yùn),李記明,姜忠軍.統(tǒng)計(jì)分析在葡萄酒質(zhì)量評(píng)價(jià)中的應(yīng)用[J].釀酒科技,2009(4):79-82
[2]李華,劉勇強(qiáng),郭安鵲,等.運(yùn)用多元統(tǒng)計(jì)分析確定葡萄酒感官特性的描述符[J].中國(guó)食品學(xué)報(bào),2007,7(4):114-118
[3]王文靜.感官評(píng)價(jià)在葡萄酒研究中的應(yīng)用[J].釀酒,2007,34(4):57-59
[4]全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽組委會(huì).2012年競(jìng)賽題A題[EB/OL].http://www.mcm.edu.cn
[5]張永利,朱艷偉.基于主成分的模糊聚類分析及應(yīng)用[J].河北理工大學(xué)學(xué)報(bào),2011,33(4):85-88
[6]周淑珍,張軍翔,曹景麗.不同氧化程度和年份葡萄酒總酚含量研究[J].釀造加工,2008(1):49-51
[7]馬麗艷,李景明.葡萄酒中順?lè)词桨邹继J醇異構(gòu)體的反相高效液相色譜法測(cè)定[J].分析測(cè)試學(xué)報(bào),2004,23(6):87-90
[8]楊晶,朱圣陶.市售干紅葡萄酒總酚的測(cè)定[J].職業(yè)與健康,2009,25(7):707-708