霍俊爽,張若東,潘淑霞,邰志艷吉林醫(yī)藥學院公共衛(wèi)生學院
基于多元線性回歸對釀酒葡萄與葡萄酒關系的研究
霍俊爽,張若東,潘淑霞,邰志艷
吉林醫(yī)藥學院公共衛(wèi)生學院
摘要:本文主要基于多元統(tǒng)計方法分析和研究了釀酒葡萄與葡萄酒關系的問題。最終得到了葡萄酒花色苷與葡萄理化指標的多元線性回歸方程。
關鍵詞:多元線性回歸;標準化;花色苷
釀酒葡萄的理化指標對葡萄酒的理化指標有著重要的影響,本文以2012全國大學生建模競賽題為例,主要基于多元統(tǒng)計分析方法對釀酒葡萄的理化指標與葡萄酒的理化指標的關系進行了研究。
由于釀酒葡萄的理化指標過多,為了防止數量級較大的數據吞沒數量級較小的數據,首先對釀酒葡萄的理化指標進行標準化處理。
2.1相關系數
相關分析是描述兩個變量間關系的密切程度,主要由相關系數值表示,當相關系數r的絕對值越接近于1,則表示兩個變量間的相關性越顯著。雙變量系數測量的主要使用Pearson相關系數,由于釀酒葡萄和葡萄酒的數據為定距數據,則在進行兩者間的相關性檢驗時用Pearson相關系數[1]來判斷,其公式為:
2.2回歸分析
多元回歸分析是研究多個變量之間關系的回歸分析方法,確定變量之間數量的可能形式,并建立如下數學模型:
其中β0為截距項,βi為偏回歸系數,ε為殘差項。
建立模型,要對模型進行擬合度檢驗,回歸方程的顯著性檢驗就是檢驗樣本回歸方程的變量的線性關系是否顯著,即能否根據樣本來推斷總體回歸方程中的多個回歸系數中至少有一個不等于0,主要是說明樣本回歸方程r2的顯著性。檢驗的方法用方差分析,這時因變量Y的總體變異系本分解為回歸平方和與誤差平方和,即表示為:Lyy=Q+U,其中
此外可以用F檢驗對整個回歸進行顯著性檢驗,即Y與所考慮的k個變量自變量是否有顯著性線性關系,即公式為:
3.1相關系數
表1 紅葡萄酒的花色苷與釀酒葡萄個別指標的相關性系數
表2 白葡萄酒的花色苷與釀酒葡萄個別指標的相關性系數
根據相關性的分析,用SPSS做多元線性回歸分析,得到紅葡萄酒花色苷與葡萄理化指標的線性回歸方程[3]為:
其中y表示紅葡萄酒的花色苷,x1、x2、x3、x4、x5、x6、x7分別表示釀酒葡萄的單寧、總酚、酒總黃酮、白藜蘆醇、DPPH、L、a的含量。通過該多元線性回歸方程可研究每1單位的釀酒葡萄的單寧、總酚、酒總黃酮、白藜蘆醇、DPPH、L、a的含量的變化所引起葡萄酒花色苷的變化。從而反映了釀酒葡萄與紅葡萄酒理化指標的定量關系。
同上可得到白葡萄酒花色苷與釀酒葡萄理化指標的多元線性回歸方程為y=0.291x1+0.904x2+0.564。
其中y表示白葡萄酒的花色苷,x1、x2分別代表葡萄白藜蘆醇、a。通過該多元線性回歸方程可研究每1單位的釀酒葡萄的白藜蘆醇、a含量的變化所引起白葡萄酒花色苷的變化。
參考文獻:
[1]張杰,基于主成分分析的紅葡萄酒評價方法研究[J].東北電力大學學報,2013,6:4146.
[2]黃菲,葡萄酒評價與釀酒葡萄分級的統(tǒng)計研究[J].生物技術世界,2013,4:43-44.
[3]朱家明,葡萄酒質量評價的定量分析[J].宜春學院學報, 2013,35:8-12.
基金項目:吉林省教育廳十二五規(guī)劃科學技術研究項目(2015393);吉林省科技發(fā)展計劃項目(20120697)。
作者簡介:霍俊爽(1982-),男,碩士,講師,研究方向:應用數學與統(tǒng)計學。