馬 爍
(荊州理工職業(yè)學(xué)院,湖北 荊州 434000)
隨著人民生活水平的不斷提高,葡萄酒已經(jīng)逐步成為人們生活中的一部分,葡萄酒多樣多變的口感,令人深陷其中.不同的人對同一種葡萄酒質(zhì)量的評價不同,確定葡萄酒質(zhì)量時一般是通過聘請一批有資質(zhì)的評酒員進行品評.每個評酒員在對葡萄酒進行品嘗后對其分類指標(biāo)打分,然后求和得到其總分,從而確定葡萄酒的質(zhì)量.
釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系,葡萄酒和釀酒葡萄檢測的理化指標(biāo)會在一定程度上反映葡萄酒和葡萄的質(zhì)量.(具體題目參見2012全國大學(xué)生數(shù)學(xué)建模競賽A題).
需要建立數(shù)學(xué)模型討論下列問題:
1) 分析兩組評酒員的評價結(jié)果有無顯著性差異,哪一組結(jié)果更可信?
2) 根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對這些釀酒葡萄進行分級.
3) 分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系.
4) 分析釀酒葡萄和葡萄酒的理化指標(biāo)對葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標(biāo)來評價葡萄酒的質(zhì)量?
1)假設(shè)葡萄酒的質(zhì)量只與釀酒葡萄的理化指標(biāo)有關(guān),而與外界其他因素?zé)o關(guān).
2)假設(shè)題目中的數(shù)據(jù)能夠真實反映各項的指標(biāo).
3)假設(shè)題目中所給的幾項理論指標(biāo)能夠很好地評價葡萄酒的好壞.
設(shè)有來自正態(tài)總體X和Y的樣本X1,X2,…,Xn和Y1,Y2,…,Yn,它們的容量相等.定義
Zi=Xi-Yi(i=1,2,…,n)
通過上面的方法對第一組10個品酒員對所有紅葡萄酒樣的總評分(總評分是指某個品酒員對某個酒樣品的分類指標(biāo)評分打分求和)和第二組的所有總評分進行顯著性檢驗,由α=0.05及df=269,查t分布表中dfmax=45,t0.05(45)=1.679 4,由于這個t值有相同的α?xí)r,隨著自由度的增加而減小.而|t|=4.085 0>1.679 4>t0.05(269),所以拒絕原假設(shè),這就說明兩組評酒員的評價結(jié)果有顯著性差異.用同樣的方法對白葡萄酒樣進行分析得到的|t|=3.228 9>1.679 4>t0.05(279),也說明兩組品酒員的評價結(jié)果有顯著性差異.
分別求出標(biāo)準(zhǔn)差最小值屬于第一組的個數(shù)an、第二組的個數(shù)bn
其中S1表示第一組的標(biāo)準(zhǔn)差集合,S2表示第二組的標(biāo)準(zhǔn)差的集合.
若an對應(yīng)的求和值大于bm對應(yīng)的求和值,則第一組的評價結(jié)果更可信;反之第二組的評價結(jié)果更可信.以下是第一組和第二組紅葡萄酒品嘗總評分的標(biāo)準(zhǔn)差數(shù)據(jù)列表.
表1 紅葡萄酒樣品的標(biāo)準(zhǔn)差
由于表1有27個酒樣品中就有20個酒樣品的標(biāo)準(zhǔn)差是第二組小于第一組,所以通過兩組標(biāo)準(zhǔn)差的比較從總體上可以說第二組的評分穩(wěn)定性要比第一組好很多,即第二組的評價結(jié)果更可信.
用同樣的方法對白葡萄酒品嘗評分標(biāo)準(zhǔn)差進行比較,同樣可以得出第二組對白葡萄酒的評分比第一組的更可信.綜上兩種葡萄酒品酒員評分的結(jié)果表明第二組的結(jié)果更可信.
3.2.1 利用主成分分析[2]減少釀酒葡萄的理化指標(biāo)
3.2.1.1 對原始數(shù)據(jù)進行處理
3.2.1.2 計算相關(guān)系數(shù)矩陣R
式中rij=1,rij=rji,rij是第i個評價與第j個指標(biāo)的相關(guān)系數(shù).
3.2.1.3 計算特征值和特征向量[3]
計算相關(guān)系數(shù)矩陣R的特征值λ1≥λ2≥…≥λm≥0,由特征向量組成m個新的指標(biāo)變量.
式中y1是第1主成分,y2是第2主成分,…,ym是第m主成分.
3.2.1.4 選擇p(p≤m)個主成分,計算綜合評價
1)計算特征值λj(j=1,2,…,m)的信息貢獻率和累積貢獻率.
表2 主成分的貢獻率表
由表2可看出主成分的貢獻率是逐漸減小的,累積貢獻率的增長幅度也是逐漸減小的.根據(jù)前8個主成分的特征值大于1,我們?nèi)∏?個主成分作為綜合理化指標(biāo)來評價釀酒葡萄的好壞.
2)計算綜合得分
其中bi為第j個主成分的信息貢獻率,根據(jù)綜合得分值就可進行評價.
上面的過程用MATLAB計算得到的結(jié)果共有27個樣品,這里只給出3個樣品,見表3.
表3 綜合評價表
表3給出了3個釀酒葡萄樣品質(zhì)量的綜合評價,也可看出主成分分析法將釀酒葡萄的理化指標(biāo)綜合成8個評價指標(biāo),且給出了這8個指標(biāo)對葡萄的好壞的評價的一個綜合得分,綜合得分越高說明葡萄的質(zhì)量越好.
3.2.2 釀酒葡萄的分級
用主成分分析法求得的葡萄樣品綜合得分的數(shù)據(jù)進行標(biāo)準(zhǔn)化處理:
其中zmax是綜合評分中的最大值,zmin是綜合評分中的最小值.
由于釀酒葡萄的理化指標(biāo)與葡萄酒的質(zhì)量對釀酒葡萄的好壞評價的重要性并不確定,所以我們假設(shè)兩者對評定釀酒葡萄等級的作用相等,即可以用兩者的和作為評價葡萄好壞的總評價得分:h=cj+cj′,其中cj′表示葡萄綜合得分的處理后的值,cj表示評價葡萄酒質(zhì)量的總分經(jīng)標(biāo)準(zhǔn)化處理的值.由cj'∈[0,1],cj∈[0,1],得到h∈[0,2] .于是釀酒葡萄的好壞可劃分為4個等級,即4個評分范圍:四級[0,0.5),三級[0.5,1),二級[1,1.5),一級[1.5,2] .分級的結(jié)果如表4.
表4 葡萄樣品等級歸類
3.3.1 選取釀酒葡萄和葡萄酒的理化指標(biāo)
首先在葡萄酒的理化指標(biāo)中選取9個一級指標(biāo),再在釀酒葡萄的理化指標(biāo)中找出相應(yīng)的9個指標(biāo).與問題2類似用主成分分析法減少理化指標(biāo),得到葡萄酒的m個主要成分作為綜合指標(biāo)記為a1,a2,…,am;得到釀酒葡萄的3個綜合指標(biāo)記為b1,b2,…,bl.附件中共有27個樣品,下面給出前3個樣品對應(yīng)的紅葡萄酒的3個綜合指標(biāo)和釀酒葡萄的3個指標(biāo)的數(shù)據(jù),如表5.
表5 葡萄酒和釀酒葡萄的主成分
白葡萄的綜合理化指標(biāo)和葡萄酒的綜合理化指標(biāo)的數(shù)據(jù)見表6.
表6 白葡萄酒和釀酒葡萄的主成分
3.3.2 釀酒葡萄與葡萄酒之間的聯(lián)系
從關(guān)聯(lián)矩陣R可以看出:
1)r11=0.953 1最大,表明釀酒葡萄3個綜合理化指標(biāo)中的第一主成分b1與葡萄酒3個綜合理化指標(biāo)中的第一主成分a1的聯(lián)系最大.
2)第2行中r23=0.886 7最大,表明釀酒葡萄綜合理化指標(biāo)中的第三主成分b3與葡萄酒綜合理化指標(biāo)中第二主成分的聯(lián)系最大.
3.3.3 白葡萄與白葡萄酒之間的聯(lián)系
計算白釀酒葡萄綜合指標(biāo)對葡萄酒綜合指標(biāo)的關(guān)聯(lián)度(ρ=0.5)從而得到關(guān)聯(lián)矩陣為
從關(guān)聯(lián)矩陣R可以看出:
1)r23=0.926 5最大,表明釀酒葡萄綜合理化指標(biāo)的第三主成分b3對葡萄酒的綜合理化指標(biāo)的第二主成分的影響最大,及聯(lián)系最密切.
2)第4行的元素幾乎最小,表明釀酒葡萄綜合理化指標(biāo)與葡萄酒的綜合理化指標(biāo)的第四主成分的關(guān)系最小,即聯(lián)系相對較小.
3.4.1 分析釀酒葡萄和葡萄的理化指標(biāo)對葡萄酒質(zhì)量的影響
釀酒葡萄的理化指標(biāo)對葡萄酒質(zhì)量的影響可以用問題2中求出的9個釀酒葡萄的綜合理化指標(biāo)與葡萄酒質(zhì)量進行相關(guān)性分析,釀酒葡萄的綜合理化指標(biāo)中與葡萄酒質(zhì)量相關(guān)性顯著的越多就說明釀酒葡萄的理化指標(biāo)對葡萄酒質(zhì)量的影響越大.
根據(jù)問題1可知將所有評酒員對某樣品的總評分平均后的最后得分就能確定葡萄酒的質(zhì)量.由于釀酒葡萄的理化指標(biāo)太多且每一項指標(biāo)的影響程度不同,應(yīng)該把一些相關(guān)性較大的指標(biāo)用主成分分析法歸為一類,這樣就減少了釀酒葡萄的理化指標(biāo),簡化釀酒葡萄理化指標(biāo)對葡萄酒質(zhì)量影響的過程,故分析釀酒葡萄對葡萄酒質(zhì)量的影響的理化指標(biāo)應(yīng)該是一些綜合的理化指標(biāo).
我們設(shè)葡萄酒質(zhì)量是一個變量y,釀酒葡萄的綜合理化指標(biāo)為多個變量x1,x2,…,xn,用相關(guān)性分析得出的相關(guān)系數(shù)確定變量xi(i=1,2,…,n)與變量y之間的關(guān)系密切程度.下面是用SPSS軟件[4]計算出的相關(guān)系數(shù)見表7.
表7 紅葡萄酒的理化指標(biāo)與葡萄酒質(zhì)量的相關(guān)系數(shù)
表7說明紅葡萄酒的理化指標(biāo)與葡萄酒質(zhì)量都是相關(guān)的,且相關(guān)系數(shù)大于或接近0.5的值較多,且相關(guān)的顯著程度也較高,這說明紅葡萄酒的理化指標(biāo)對葡萄酒質(zhì)量的影響很大.表中只有L*(D65)這一個理化指標(biāo)與葡萄酒的質(zhì)量呈負相關(guān).同理可得出白葡萄和白葡萄酒的理化指標(biāo)與葡萄酒質(zhì)量的相關(guān)系數(shù),這里不再列出.
3.4.2 論證能否用葡萄和葡萄酒的理論指標(biāo)評價葡萄酒的質(zhì)量
首先對附件3(具體參見2012全國大學(xué)生數(shù)學(xué)建模競賽A題)中的葡萄酒的各種成分進行主成分分析得到一些綜合成分,然后選取附件1中第二組品酒評分,在三個判別葡萄酒質(zhì)量的指標(biāo)中選取香味分析,對這個指標(biāo)中的單個因素求和得到這個指標(biāo)的總分,即求一個樣品中某個評酒員評酒的一個指標(biāo)的總分.再求出10個評酒員對這個指標(biāo)的評分的平均值.我們選取這個指標(biāo)作為葡萄酒的質(zhì)量與葡萄酒的各個主成分進行相關(guān)性分析,得到的相關(guān)系數(shù)就是氣味分析對葡萄酒質(zhì)量的影響程度的一個度量.下面是通過SPSS軟件[4]求得的氣味分析指標(biāo)與紅葡萄和紅葡萄酒之間的相關(guān)系數(shù)見表8.
表8 氣味指標(biāo)與紅葡萄酒中綜合成分的相關(guān)系數(shù)
表8中的相關(guān)系數(shù)都是不等于0的,且有三個主成分與氣味指標(biāo)是有顯著性關(guān)系的.這說明氣味指標(biāo)對葡萄酒的質(zhì)量也是有一定影響的.有上面的表格中氣味指標(biāo)與葡萄酒綜合成分的相關(guān)系數(shù)說明氣味分析對葡萄酒質(zhì)量也是有影響的,從而從反面論證了附件2(具體參見2012全國大學(xué)生數(shù)學(xué)建模競賽A題)中所給葡萄和葡萄酒的理論指標(biāo)不能評價葡萄酒的質(zhì)量,它只能在一定程度上影響葡萄酒的質(zhì)量.