王甲福,常海天
(長春工業(yè)大學,吉林 長春 130012)
偏最小二乘法在西門塔爾牛體尺估測中的應用
王甲福,常海天
(長春工業(yè)大學,吉林 長春 130012)
偏最小二乘法能有效解決多元回歸分析中變量的多重共線性問題。選用牛體重、體高兩個參數(shù)做自變量估測牛的胸圍和腹圍,應用所建立的線性模型對184頭西門塔爾牛的數(shù)據(jù)進行誤差分析,腹圍平均相對誤差為3.742%,胸圍平均相對誤差為4.385%.證明所得偏最小二乘回歸模型具有較好的精度,模型能應用到種牛的選育過程中,具有較強的實用性。
偏最小二乘回歸法;牛體尺測量;西門塔爾牛
目前,傳統(tǒng)的牛體體尺、體重測量大多使用測杖、卷尺、圓形測定器、地衡(磅秤)等工具進行人工測量,測量過程中測量者需要對牛進行接觸式測量,這種測量方式工作量大且伴有一定的危險性。接觸式測量會對牛造成應激反應,影響牛的生長和發(fā)育。文章通過偏最小二乘法建立線性回歸分析模型,經(jīng)過各項體尺數(shù)據(jù)的相關性分析,選用體重和體高兩項體尺作為指標,對牛的胸圍和腹圍進行估測。
(1)材料來源。試驗數(shù)據(jù)均來自國內(nèi)某養(yǎng)牛場。數(shù)據(jù)統(tǒng)計日期從2010年到2012年,記錄了184頭牛在0月齡、6月齡、12月齡、18月齡、24月齡的體重、體高、十字部高、體斜長、胸圍、腹圍信息。其中體重使用地磅稱重;體高指耆甲最高點到地面的垂直距離,用測杖或皮尺測量;體斜長指肩端至坐骨端的距離,用測杖或皮尺測量;胸圍是指肩胛骨后端,圍繞胸部一周的長度,用軟尺測量;腹圍是腰部圍繞腹部一周的長度,用軟尺測量;十字部高為十字部到地面的垂直高度,用測杖或直尺測量。
(2)相關性分析。以18月齡牛的數(shù)據(jù)為例,利用SPSS軟件,對體重、體高、十字部高、體斜長、胸圍、腹圍六個變量進行相關性分析,并使用皮爾遜雙側檢驗法檢驗其顯著性,統(tǒng)計結果如表1所示。
表1 皮爾遜相關系數(shù)統(tǒng)計表
從表1中可知體重、體高、十字部高、體斜長、胸圍、腹圍各變量間相關達到極顯著水平,體高與十字部高具有極強相關性,與體斜長具有強相關性;胸圍和體斜長、腹圍具有強相關性??梢娫诠罍y胸圍、腹圍時,自變量間存在一定的共線性問題。由于變量間共線性問題的存在,運用普通最小二乘法(OLS)回歸分析所建立的數(shù)學模型會失真或難以估計準確。
(3)用偏最小二乘法建立線性回歸分析模型。為了有效解決自變量間共線性問題,文章通過偏最小二乘法(PLS)建立線性回歸分析模型。偏最小二乘回歸分析法采用成分提取的方法,在成分提取時選擇對自變量和因變量解釋性最強的綜合變量,排除噪聲干擾。
考慮到模型的實用性和可操作性,選取實際測量時較容易測量的體重和體高作為自變量,利用SPSS中PLS模塊對胸圍和腹圍進行估測。部分實測數(shù)據(jù)如表2所示。
表2 18月齡西門塔爾牛體尺數(shù)據(jù)
胸圍估測模型:y1=1.812x2-0.037x2-39.418;
腹圍估測模型:=y2=1.804x1-0.046x2-11.809;
其中x1為體高,x2為體重。
預測值與實測值的吻合程度檢驗的常用方法有誤差百分比法和線性回歸檢驗法。文章采用誤差百分比法,將實測數(shù)據(jù)帶入模型中,用估測值與實測值進行對比分析,部分結果如表3所示,184頭牛估測值與實測值的胸圍平均相對誤差率為3.633%,腹圍平均相對誤差率為4.361%,其中胸圍最大相對誤差為10.41%,腹圍最大相對誤差為11.96%,胸圍相對誤差低于7%的數(shù)據(jù)占總量的83.7%,腹圍相對誤差低于7%的數(shù)據(jù)占總量的93.6%,同時考慮到人工測量和記錄數(shù)據(jù)過程中不可避免的會產(chǎn)生數(shù)據(jù)偏差,因此估測的數(shù)學模型能夠滿足實際應用中對誤差的要求。
表3 實際胸圍、腹圍尺寸與估測胸圍、腹圍尺寸表
文章通過偏最小二乘法回歸分析分別對不同月齡的牛胸圍和腹圍建立估測模型,模型精度和準確度都能滿足實際應用中的要求,結合牛場在測量數(shù)據(jù)時的實際情況,選用體重和體高兩項比較方便測量的數(shù)據(jù)作為自變量進行建模,所建立的數(shù)學模型較以往的經(jīng)驗公式有很強的準確性和科學性優(yōu)勢,可結合圖像和視覺構建非接觸測量系統(tǒng),具有很好的實用性。但由于估測模型為靜態(tài)模型,在測量體型特殊的對象時會有一定的偏差。
[1]陸洪濤.偏最小二乘回歸數(shù)學模型及其算法研究[D].北京:華北電力大學,2014.
[2]鄧衛(wèi)東,劉萬洪,王彥豐,等.云南省西門塔爾牛生長模型的建立[J].中國畜牧獸醫(yī),2007,34(5):143-145.
王甲福(1966-),吉林吉林人,主要研究方向:模式識別與智能系統(tǒng)。