康 衛(wèi),盛曉艷
(阜陽師范學(xué)院信息工程學(xué)院,安徽阜陽236041)
一類葡萄酒質(zhì)量評估模型研究
康 衛(wèi),盛曉艷
(阜陽師范學(xué)院信息工程學(xué)院,安徽阜陽236041)
主要利用主成分分析和多元線性回歸分析得出了釀酒葡萄和葡萄酒的理化指標(biāo)與葡萄酒質(zhì)量的函數(shù)關(guān)系,利用殘差分析,檢驗(yàn)出多元線性回歸模型是可行性的.最后把理化指標(biāo)分析法和感官評價(jià)相結(jié)合構(gòu)建出紅葡萄酒質(zhì)量評估模型,使評價(jià)模型更加客觀完善.
主成分分析法;相關(guān)性分析;多元線性回歸分析;殘差檢驗(yàn)
紅葡萄酒是馳名國內(nèi)外的一種飲料酒,也是國家大力生產(chǎn)發(fā)展中酒類產(chǎn)品的重點(diǎn)發(fā)展品種.目前在國際市場上,紅葡萄酒的質(zhì)量評估依然以專業(yè)評酒員的評定為依托.由于評酒員間存在評價(jià)尺度、評價(jià)位置和評價(jià)方向等方面的差異,不同評酒員對同一酒樣的評價(jià)結(jié)果不同,導(dǎo)致評價(jià)結(jié)果的不客觀性.因此我們急需一套客觀的、完善的評估模型來評估紅葡萄酒質(zhì)量.
1.1 材料
選取不同成品的紅葡萄酒和釀酒紅葡萄各27種,得到相關(guān)理化指標(biāo)的數(shù)據(jù).
1.2 數(shù)據(jù)來源
2012年全國大學(xué)生數(shù)學(xué)建模A題:第二組紅葡萄酒品嘗評分表、釀酒紅葡萄和紅葡萄酒的理化指標(biāo).
2.1 模型概要
本文把感官評價(jià)法和理化指標(biāo)分析法結(jié)合起來構(gòu)建紅葡萄酒質(zhì)量綜合性評估模型.把理化指標(biāo)分析法加入到傳統(tǒng)的紅葡萄酒評價(jià)模型中,這樣降低了在感官評價(jià)中因個(gè)體差異對結(jié)果可靠性造成的影響,使評估結(jié)果更加可靠,評估模型更加完善.在具體評估時(shí),應(yīng)該合理確定感官評價(jià)結(jié)果和理化指標(biāo)評估結(jié)果各自所占的權(quán)重.
2.2 模型的求解
2.2.1 主成分分析模型的建立
主成分分析是把原來多個(gè)變量化為少數(shù)幾個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)分析方法,從數(shù)學(xué)角度來看,這是一種降維處理技術(shù).根據(jù)實(shí)際需要從中選取載荷較大的理化指標(biāo).
具體步驟如下:
(1)數(shù)據(jù)的標(biāo)準(zhǔn)化處理
利用公式:
其中xij為第i種樣品葡萄第j個(gè)指標(biāo)的值為第j個(gè)指標(biāo)的樣本均值和樣本標(biāo)準(zhǔn)差.
(2)計(jì)算相關(guān)系數(shù)矩陣
rij(i,j=1,2,…,p)為原變量xi和xj的相關(guān)系數(shù),其中rij=rji,計(jì)算公式為:
(3)計(jì)算特征值和特征向量
(4)計(jì)算主成分貢獻(xiàn)率及累計(jì)貢獻(xiàn)率
取累計(jì)貢獻(xiàn)率達(dá)到70%的特征值λ1,λ,2,…,λm所對應(yīng)的第1,2,…,m(m≤p)個(gè)主成分;
(5)計(jì)算主成分載荷
設(shè)它們降維處理后的綜合指標(biāo),即新變量為z1,z2,…,zm(m≤p),
其中l(wèi)ij=p(zi,xj)=(i,j=1,2,…,p)
2.2.2 用主成分分析法分析釀酒紅葡萄和紅葡萄酒載荷較大的理化指標(biāo)
分別對27種釀酒紅葡萄和紅葡萄酒一級(jí)理性指標(biāo)進(jìn)行主成分分析后,得到五個(gè)主成分,累計(jì)貢獻(xiàn)率大于85%,具有統(tǒng)計(jì)學(xué)上的意義.
(1)利用Matlab軟件得到釀酒紅葡萄主因子載荷矩陣如表1(Xi表示紅葡萄的一級(jí)理化指標(biāo)因子)
表1 正交旋轉(zhuǎn)后的主因子載荷矩陣(紅葡萄)
取得前五個(gè)主成分,各理化指標(biāo)因子的二維載荷主平面數(shù)據(jù)表.可知:對于主成分Z1中各個(gè)因子載荷值,從正方向上看,比較大的是果皮質(zhì)量,從負(fù)方向上看比較大的是花色苷,單寧,分別為-0.827 3,-0.507 4.依次分析五種主成分,得出載荷較大的理化指標(biāo)因子為:花色苷鮮重,DPPH自由基,總酚,白藜蘆醇,總糖,可溶性固形物,干物質(zhì)含量,果皮質(zhì)量.我們分別令它們?yōu)樽宰兞縓1,X2,X3,…,X8.
(2)利用Matlab編程運(yùn)行得到主因子載荷矩陣如表2(Xi表示紅葡萄的一級(jí)理化指標(biāo)因子)
表2 正交旋轉(zhuǎn)后的主因子載荷矩陣(紅葡萄酒)
取得前五個(gè)主成分,各理化指標(biāo)因子的二維載荷主平面數(shù)據(jù)表(見表2).依次分析五種主成分,得出紅葡萄酒載荷較大的理化指標(biāo)因子為:單寧,總酚,酒總黃酮,DPPH半抑制劑,色澤L*.分別令其為因變量x9,x10,x11,x12,x13.
2.2.3 分析釀酒紅葡萄與紅葡萄酒的理化指標(biāo)之間的聯(lián)系
分析釀酒紅葡萄與紅葡萄酒的理化指標(biāo)之間的聯(lián)系,要對每一個(gè)理化指標(biāo)因子進(jìn)行分析,顯然這是不可行的.那么,我們首先分別用主成分分析法分析出釀酒紅葡萄與紅葡萄酒載荷較大的理化指標(biāo).另外從化學(xué)角度分析一下紅葡萄酒的某項(xiàng)理化指標(biāo)跟葡萄的某項(xiàng)理化指標(biāo)顯著相關(guān)的理化指標(biāo),求出紅葡萄與紅葡萄酒相應(yīng)的理化指標(biāo)之間的相關(guān)系數(shù).從而減少了需要比較的因子數(shù).結(jié)果如表3所示.
表3 紅葡萄與紅葡萄酒的理化指標(biāo)之間的相關(guān)系數(shù)
我們規(guī)定兩者的相關(guān)系數(shù)絕對值大于0.6時(shí),認(rèn)為兩者的相關(guān)性顯著.
2.2.4 定量分析釀酒紅葡萄和紅葡萄酒的理化指標(biāo)對紅葡萄酒質(zhì)量的影響
上面我們用主成分分析法得到釀酒紅葡萄與紅葡萄酒的所有載荷較大的理化指標(biāo)因子,以它們?yōu)樽宰兞?,把紅葡萄酒的質(zhì)量看作因變量,運(yùn)用matlab軟件用多元線性回歸的方法得到自變量與因變量的函數(shù)表達(dá)式,從而定量的分析釀酒紅葡萄和紅葡萄酒的理化指標(biāo)與紅葡萄酒質(zhì)量的確切關(guān)系.
用y表示紅葡萄酒質(zhì)量,運(yùn)用matlab進(jìn)行多元線性回歸后得到的數(shù)學(xué)表達(dá)式為:
2.2.5 殘差檢驗(yàn)
為了避免在實(shí)際問題中,由于觀察人員的粗心或偶然因素的干擾造成數(shù)據(jù)的不可靠,為此我們做出紅葡萄酒品種數(shù)據(jù)的殘差圖,以此來分析多元線性回歸模型的可行性.結(jié)果如圖1所示.
由圖1很容易看出,在27類數(shù)據(jù)中,除第26類數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)都較近,并且它們殘差的置信區(qū)間都包含了零點(diǎn),由此看來多元線性回歸能較好的符合原始數(shù)據(jù),而第26類數(shù)據(jù)可視為異常.并進(jìn)一步論證了用釀酒紅葡萄和紅葡萄酒的理化指標(biāo)評價(jià)紅葡萄酒質(zhì)量的可行性,證明了多元線性回歸模型的可靠性.
圖1 紅葡萄酒品種數(shù)據(jù)的殘差圖
3.1 模型的總結(jié)分析
本文主要利用主成分分析,多元線性回歸分析及殘差檢驗(yàn)等統(tǒng)計(jì)方法研究了釀酒紅葡萄和紅葡萄酒的理化指標(biāo)之間的聯(lián)系以及釀酒紅葡萄和紅葡萄酒的理化指標(biāo)與紅葡萄酒質(zhì)量的關(guān)系等問題,獲得了釀酒紅葡萄和紅葡萄酒的理化指標(biāo)與紅葡萄酒質(zhì)量的方程.多元線性回歸方程的方案,使得研究變得簡單.但是模型在處理具體問題時(shí)難免存在著一些缺點(diǎn),例如,對釀酒紅葡萄與紅葡萄酒的理化指標(biāo)之間的聯(lián)系只是做了定性的分析.
3.2 模型拓展分析
本文是對紅葡萄酒質(zhì)量評估模型的探究.當(dāng)今社會(huì)食品安全已經(jīng)成為我們最為關(guān)心的問題,并且在安全的基礎(chǔ)上人們希望追求更高的品質(zhì).該紅葡萄酒的質(zhì)量評估模型,具有很大的延伸意義.一方面,我們可以用這種方法對酒品質(zhì)量進(jìn)行評估;另一方面,也給釀酒廠家在選材方面提供了可靠的參考.
[1] 王文靜.感官評價(jià)在紅葡萄酒研究中的應(yīng)用[J].釀酒,2007,34(4):57-59.
[2] [美]FRANK R,GIORDAN O.A first course in mathematicalmodeling[M].Fourth Edition.Cengage Learning,2009.
[3] 何曉群.多元統(tǒng)計(jì)分析[M].北京:中國人大學(xué)出版社,2008.
[4] 楊桂元,黃已立.數(shù)學(xué)建模[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2009.
[5] 劉衛(wèi)國.MATLAB程序設(shè)計(jì)與應(yīng)用[M].北京:高等教育出版社,2006.
[6] 姜啟源.數(shù)學(xué)建模[M].2版.北京:高等教育出版社,2008.
[責(zé)任編輯 王新奇]
A Probe into W ine Quality Assessment M odel
KANGWei,SHENG Xiao-yan
(College of Information Engineering,F(xiàn)uyang Teachers College,F(xiàn)uyang 236041,China)
Adopting themethods of principal component analysis and multiple linear regression analysis,we have obtained functional relationship between wine quality and physicochemical indexes of grapes and grape wine.Residual test has proven the feasibility ofmulti-linear regression analysis.By combining the physicochemical indexes and organoleptic evaluation,we have constructed a new red wine quality assessmentmodel,which is supposed to be an improved one.
principal component analysis;correlation analysis;multiple linear regression analysis;residual test
1008-5564(2015)01-0027-05
O212.4
A
2014-09-12
國家自然科學(xué)基金天元基金(11226140);安徽省自然科學(xué)研究項(xiàng)目(KJ2013Z267);阜陽師范學(xué)院自然科學(xué)研究項(xiàng)目(2013FSKJ09);阜陽師范學(xué)院教學(xué)改革研究項(xiàng)目(2013JYXM48)
康 衛(wèi)(1985—),男,安徽亳州人,阜陽師范學(xué)院信息工程學(xué)院助教,博士研究生,主要從事數(shù)學(xué)建模,控制理論研究.
西安文理學(xué)院學(xué)報(bào)(自然科學(xué)版)2015年1期