資燕仙
對葡萄酒的質(zhì)量等級劃分,主要是由一些資深的品酒員對其的打分來衡量的,而不同的品酒員對同一葡萄酒評分各不相同,為了對某一葡萄酒的質(zhì)量給出一個(gè)評價(jià),我們就有必要檢驗(yàn)不同組品酒員打分的可信度??紤]到上述同題,文章首先對題目所給的數(shù)據(jù)進(jìn)行了清洗,然后用統(tǒng)計(jì)上的假設(shè)檢驗(yàn)方法對不同組品酒員的打分進(jìn)行檢驗(yàn),再用變異系數(shù)對可信度進(jìn)行判定。
假設(shè)檢驗(yàn) 主成分分析
研究背景
隨著經(jīng)濟(jì)的發(fā)展,人們生活水平的不斷提高,各類進(jìn)口葡萄酒不斷的涌人中國市場,不僅引起了創(chuàng)業(yè)者對其的興趣,也吸引了很多中國學(xué)者對其的研究。
由于葡萄酒越來越受廣大人民的喜愛,這在一定程度上也吸引了一些學(xué)者、研究員、分析師的的目光,經(jīng)過查閱資料發(fā)現(xiàn)各個(gè)領(lǐng)域?qū)ζ咸丫贫甲隽艘恍┒ㄐ院投康难芯?。鹿文麗,楊潘,王晶?2017)以煙臺葡萄酒旅游業(yè)為例,分析了葡萄酒旅游業(yè)中現(xiàn)代信息技術(shù)的應(yīng)用程度和提升空間;林博學(xué)( 2017)研究了葡萄酒瓶上的軟木塞應(yīng)該如何制造才能使得葡萄酒的密封效果最好;黃鴻基,錢圳冰,馮帆,周行洲( 2017)根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量利用統(tǒng)計(jì)的方法來對釀酒葡萄進(jìn)行分級。
綜上,眾多學(xué)者都對葡萄酒進(jìn)行了研究。但大部分學(xué)者都沒有對評酒員對葡萄酒的評分進(jìn)行判定分析。針對研究的不足,文章在下文中對葡萄酒的不同組評酒員的評分進(jìn)行了判定。
本文利用的數(shù)據(jù)是2012年全國大學(xué)生數(shù)學(xué)建模競賽A題的數(shù)據(jù),由于文章研究的問題與競賽題目的問題有所差異,因此,文章只用了附件1的數(shù)據(jù),來分析附件1中兩組評酒員的評價(jià)結(jié)果有無顯著差異,哪一組結(jié)果更可信。
模型建立與求解
(1)問題分析
葡萄酒的感官評價(jià)中,不同的品酒員對葡萄酒的評價(jià)在評價(jià)尺度方面存在不同的差異,由于定性分析總是不能使人們信服,所以就需要利用統(tǒng)計(jì)方法來對其進(jìn)行檢驗(yàn);其次為了對葡萄酒選取一組質(zhì)量評分標(biāo)準(zhǔn),將利用統(tǒng)計(jì)方法從定量分析的基礎(chǔ)上確定出一組評分做為葡萄酒的質(zhì)量評選標(biāo)準(zhǔn)。
(2)模型建立與求解
1.正態(tài)性檢驗(yàn)
對于問題一文章采用每組評酒員對每一樣品各個(gè)理化指標(biāo)打分的總和數(shù)據(jù)來分析,首先對附件一的兩組數(shù)據(jù)用Excel進(jìn)行加總分別得出紅門兩種葡萄得分的27個(gè)或28個(gè)總分值;其次,對數(shù)據(jù)文件1中的每一組數(shù)據(jù)用RStudio進(jìn)行正太性檢驗(yàn),文章將采用JB進(jìn)行檢驗(yàn),得到的四個(gè)JB值分別為4.01,3.20,2.09,1.98,均小于臨界值5.99,故四組數(shù)據(jù)近似服從正太分布。
2.對兩組品酒員評分顯著性檢驗(yàn)
根據(jù)上述檢驗(yàn),每組評酒員對每一樣品評分的平均值服從正太分布,因此對第一組紅葡萄酒樣品,可以設(shè)λi:N(μi,σi)i=1,2,L,27,第二組紅葡萄 酒 樣 品 , 可 以 設(shè)λj:N(μj,σj),j=1,2,L,27,則對第一組和第二組紅葡萄酒樣品的評分有無顯著性差異的問題,可以轉(zhuǎn)化為如下假設(shè)檢驗(yàn)?zāi)P停?/p>
Ho:μi=μj,Hl:μi≠μj
(1)
因?yàn)閮山M紅葡萄酒評分的方差均不知道并且不可能相等,進(jìn)而不能進(jìn)行假設(shè)檢驗(yàn),于是將表達(dá)形式變形為D=λi-λj,則樣本均值變?yōu)棣?μi-μj,因此第一個(gè)假設(shè)檢驗(yàn)變?yōu)閷Α?0的t檢驗(yàn)。變換后的樣本均值數(shù)據(jù)見數(shù)據(jù)文件l,利用RStudio對第一組和第二組紅葡萄酒樣品平均值評分的差進(jìn)行t檢驗(yàn),
分析運(yùn)算結(jié)果可知,在顯著性水平α=0.05下,p=1.027e-09小于其水平,因此拒絕原假設(shè),即μi=μj,也就是說兩組品酒員對紅葡萄酒的評分存在顯著性差異,同理,對于門葡萄酒,在顯著性水平α=0.05下,p=1.027e-09小于其水平。綜上,兩組品酒員對紅、門兩組葡萄酒的打分存在顯著差異。
其次,對第二個(gè)方差假設(shè)檢驗(yàn)進(jìn)行F檢驗(yàn):
首先求出第一組和第二組中每一品酒員對紅葡萄酒每一樣品打分的和后,再求每組中每一樣品的方差,最后用RStudio對處理后的數(shù)據(jù)進(jìn)行編程分析。
根據(jù)運(yùn)行結(jié)果中p=0.04198,在在顯著性水平α =0.05下,拒絕原假設(shè),說明兩組品酒員對紅葡萄酒的評分存在差異。采用同樣的方法,對兩組門葡萄酒的每一樣品評分?jǐn)?shù)據(jù)進(jìn)行分析,可得p=0.04088,在α=0.05下,拒絕原假設(shè),說明兩組品酒員對門葡萄酒的評分存在差異。
綜上,兩組品酒員對紅門葡萄酒的評分在均值和方差上都存在顯著性差異,所以可認(rèn)為評酒員對紅白葡萄酒的兩組評價(jià)結(jié)果有顯著性差異。
(3)兩組品酒員評價(jià)結(jié)果可信度評估
要評價(jià)兩組品酒員的評價(jià)結(jié)果的可信度,就要看兩組評分中哪一組更穩(wěn)定,因此用變異系數(shù)來判定,它常用來衡量樣本值的離散程度,其值越小表示樣本越集中,穩(wěn)定性越好,可信度越高,反之。變異系數(shù)的計(jì)算公式如下:
其中σ表示樣本標(biāo)準(zhǔn)差,x表示樣本均值。
利用Excel計(jì)算了每一組品酒員的變異系數(shù),第一組紅、白葡萄為;9,86%、6.88%;第一組紅、白葡萄為:5.54%、4.07%??梢钥闯龅谝唤M品酒員對紅、門葡萄酒的評分變異系數(shù)遠(yuǎn)大于第二組的變異系數(shù)。所以,可以確定第二組品酒員的評分結(jié)果更可靠。
結(jié)論
文章利用2012年全國大學(xué)生數(shù)學(xué)建模競賽A題的數(shù)據(jù),來對釀酒葡萄和葡萄酒進(jìn)行分析。首先通過假設(shè)檢驗(yàn)驗(yàn)證了附件1中兩組評酒員對葡萄酒的評分存在顯著差異,最后用變異系數(shù)證明了第二組評酒員的評分可信度更高。
[1]網(wǎng)絡(luò)資源:http: //baike.sogou.com/v66069.htm?fromTitle=%E8%91%A1%E8%90%84%E9%85%92, 2017.
[2]鹿文麗,楊潘,王晶.信息技術(shù)與葡萄酒旅游融合模式研究[J]沖國農(nóng)業(yè)大學(xué)煙臺研究院,2017.
[3]林博學(xué).葡萄酒用軟木塞的生產(chǎn)及品質(zhì)控制[J].煙臺張?jiān)F咸厌劸乒煞萦邢薰荆?017.
[4]黃鴻基,錢圳冰,馮帆,周行洲.基于改進(jìn)后的K-means算法研究根據(jù)釀酒葡萄和葡萄酒的理化指標(biāo)對紅葡萄酒的分級方法[J].南京郵電大學(xué),2017.
[5]趙靜,但琦.數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)[M].高等教育出版社.2014, 191-270.
[6]費(fèi)宇.多元統(tǒng)計(jì)分析——基于R[M].中國人民大學(xué)出版社.2014.