應(yīng)希源
(曲靖職業(yè)技術(shù)學(xué)院公共課教學(xué)部,云南 曲靖 655000)
砂糖橘是生活中常見的水果,果實(shí)大小及質(zhì)量是植物基因表達(dá)、生長狀況等屬性的表征,同時(shí)也是果實(shí)外在品質(zhì)的表現(xiàn)。植物的生長狀況及生長環(huán)境是影響植物果實(shí)發(fā)育、成長、成熟的重要因素,因此,通過圖像技術(shù)對(duì)砂糖橘體積及質(zhì)量進(jìn)行預(yù)測(cè),可以為植物生長狀況分析、栽培管理優(yōu)化等提供一定的參考,植物果實(shí)體積、質(zhì)量的快速測(cè)量對(duì)研究植物特性和優(yōu)質(zhì)豐產(chǎn)培育具有重要意義[1-6]。
機(jī)器視覺無損檢測(cè)分級(jí)是實(shí)現(xiàn)自動(dòng)化分級(jí)的重要發(fā)展方向,而形狀和重量是劃分砂糖橘級(jí)別的重要指標(biāo),因此,對(duì)砂糖橘體積、質(zhì)量進(jìn)行線性回歸分析,為自動(dòng)化分級(jí)研究提供參考模型,具有一定的實(shí)際意義。
彭麗君[7]在球坐標(biāo)的基礎(chǔ)上對(duì)植物果實(shí)砂糖橘三維點(diǎn)云開展研究,對(duì)果實(shí)進(jìn)行長寬高、體積精細(xì)測(cè)量,與測(cè)量值比較的平均誤差分別為3 mm、2.3 mL。史燕山等[8]以蘋果的縱徑、橫徑、周長、縱徑橫徑乘積分別與果實(shí)體積和果實(shí)重量進(jìn)行了線性回歸及一元非線性回歸分析。張青等[9]通過多元線性回歸分析建立了草莓重量分級(jí)模型,提出了一種基于機(jī)器視覺技術(shù)的草莓重量與形狀分級(jí)方法。本文在此基礎(chǔ)上,以市場(chǎng)上售賣的砂糖橘果實(shí)為材料,對(duì)縱徑、橫徑、周長、橫向投影面積分別與果實(shí)的體積和質(zhì)量進(jìn)行一元、多元線性回歸分析,為植物生長狀況分析及果實(shí)自動(dòng)分級(jí)提供參考。
采用圖像法獲取砂糖橘的縱徑、橫徑、周長、橫向投影面積數(shù)據(jù),采用量筒、機(jī)械天平分別測(cè)得砂糖橘的體積及質(zhì)量數(shù)據(jù),再分別進(jìn)行一元、多元線性回歸分析。測(cè)量質(zhì)量的天平型號(hào)為HC-TP11-2,最大稱量200 g,分度值0.2 g。
圖像法獲取砂糖橘數(shù)據(jù)步驟如下:1)在A4白紙上打印一個(gè)2.0 cm×2.0 cm的正方形作為參照物,將砂糖橘編號(hào)后放置在A4紙上,再用手機(jī)在垂直上空居中位置拍照;2)打開PotoshopCS6軟件,插入步驟1)所得圖片,用“標(biāo)尺”工具沿著正方形的水平位置畫一條線段,點(diǎn)擊“拉直圖層”將圖片調(diào)正;3)讀取圖像分辨率(本例為72像素/英寸),依次點(diǎn)擊“圖像”“分析”“設(shè)置測(cè)量比例”“自定”,像素長度設(shè)為“72”,邏輯長度設(shè)為“2.54”,邏輯單位設(shè)為“厘米”;4)調(diào)出“標(biāo)尺工具”測(cè)量正方形的寬和高,再根據(jù)實(shí)際長度2.0 cm計(jì)算縮放比例后再調(diào)整圖像大小,再測(cè)量參照物正方形的寬高,直至標(biāo)尺測(cè)量長度為2.0 cm;5)用“快速選擇”工具建立砂糖橘待測(cè)選區(qū),依次點(diǎn)擊“圖像”“分析”“記錄測(cè)量”便可得到縱徑、橫徑、周長、橫向投影面積數(shù)據(jù),測(cè)量結(jié)束后再批量導(dǎo)出數(shù)據(jù)。
運(yùn)用上述方法對(duì)某一品種的砂糖橘測(cè)量了30組數(shù)據(jù)作為實(shí)驗(yàn)樣本。分別繪制砂糖橘體積概率分布圖及砂糖橘質(zhì)量概率分布圖,從圖1、圖2可以看出砂糖橘體積、質(zhì)量概率分布接近正態(tài)分布。從獲取數(shù)據(jù)的散點(diǎn)圖可以初步得出體積及質(zhì)量與橫徑、縱徑、橫向投影面積呈線性關(guān)系。回歸分析采用學(xué)生常用的辦公軟件:Microsoft Excel 2010,體積、質(zhì)量分別用V(單位:cm3)、m(單位:g)表示,縱徑(單位:cm)、橫徑(單位:cm)、周長(單位:cm)、橫向投影面積(單位:cm2)分別用x1、x2、x3、x4表示。
圖1 砂糖橘體積概率分布圖
圖2 砂糖橘質(zhì)量概率分布圖
分別對(duì)砂糖橘體積V與x1、V與x2、V與x3、V與x4進(jìn)行一元線性回歸,置信度取95%,擬合結(jié)果如表1所示,從表1可以看出,砂糖橘體積與橫向投影面積x4的擬合效果最好,具有顯著的線性相關(guān)關(guān)系。根據(jù)參數(shù)F、Significanc F大小得出擬合模型通過F檢驗(yàn)。擬合表達(dá)式V=-7.21+2.41x4為較優(yōu)的一元線性擬合模型,在所選的變量中,砂糖橘體積受橫向投影面積影響最大。
表1 砂糖橘體積一元線性擬合結(jié)果
砂糖橘質(zhì)量的一元線性回歸步驟與體積的一元線性回歸步驟一致,經(jīng)擬合檢驗(yàn)后得到通過F檢驗(yàn)的模型為m=-54.31+5.32x3,砂糖橘質(zhì)量受周長影響最大。
利用Microsoft Excel 2010的多元線性回歸工具,對(duì)砂糖橘體積與縱徑x1、橫徑x2、周長x3、橫向投影面積x4四個(gè)變量建立體積模型,置信度取95%,擬合結(jié)果如表2所示,由Significance F值<0.05可得模型通過F檢驗(yàn),但根據(jù)t檢驗(yàn)的P-value值(簡(jiǎn)稱“P值”)得出模型變量未通過t檢驗(yàn),因此將P值最大的變量x1刪除后再重復(fù)進(jìn)行擬合、檢驗(yàn),經(jīng)4次擬合、檢驗(yàn)后得到通過F檢驗(yàn)及t檢驗(yàn)的模型為V=-7.21+2.41x4。
表2 砂糖橘體積多元線性擬合結(jié)果
砂糖橘質(zhì)量的多元線性回歸步驟與體積的多元線性回歸步驟一致,經(jīng)四次擬合檢驗(yàn)后得到通過F檢驗(yàn)、t檢驗(yàn)的模型為m=-54.31+5.32x3。
對(duì)砂糖橘體積、質(zhì)量進(jìn)行多元線性回歸時(shí),體積、質(zhì)量對(duì)全變量多元回歸得到的模型均通過F檢驗(yàn),說明回歸方程總體是線性相關(guān)的,但并不能說明回歸方程中所有自變量都對(duì)因變量有顯著影響[10],因此還要對(duì)回歸系數(shù)進(jìn)行t檢驗(yàn)。若自變量對(duì)應(yīng)的P值未大于0.05,則該自變量未通過t檢驗(yàn),此時(shí)采用后退法,將P值最大的變量刪除后再進(jìn)行回歸檢驗(yàn),直至回歸模型同時(shí)通過F檢驗(yàn)及t檢驗(yàn)。在本例中,直至剩余自變量為1個(gè)時(shí),回歸總體方程及系數(shù)才通過F檢驗(yàn)及t檢驗(yàn),出現(xiàn)此種情況,主要因?yàn)閯傞_始選取的自變量中存在多重共線性。采用逐步刪除變量方法進(jìn)行多元線性回歸后得到的較優(yōu)模型與一元線性回歸比較得到的較優(yōu)模型一致,較優(yōu)的體積模型為V=-7.21+2.41x4,較優(yōu)的質(zhì)量模型為m=-54.31+5.32x3,也即砂糖橘的體積與橫向投影面積顯著相關(guān),砂糖橘的質(zhì)量與投影面的周長顯著相關(guān)。
采用線性回歸分析得出的較優(yōu)體積、質(zhì)量模型對(duì)砂糖橘的體積及質(zhì)量進(jìn)行預(yù)測(cè)。具體步驟為:1)選取該品種的10個(gè)砂糖橘,通過測(cè)量獲取體積、質(zhì)量、周長、橫向投影面積數(shù)據(jù);2)將砂糖橘的橫向投影面積代入體積模型、將周長代入質(zhì)量模型,計(jì)算出砂糖橘的體積及質(zhì)量;3)將計(jì)算值與測(cè)量值進(jìn)行比較。模型預(yù)測(cè)結(jié)果如表3所示,線性回歸模型預(yù)測(cè)砂糖橘體積及質(zhì)量與測(cè)量值比較的平均相對(duì)誤差分別為4.94%、6.52%。
表3 較優(yōu)一元及多元線性回歸模型的預(yù)測(cè)結(jié)果
對(duì)某一品種砂糖橘的體積及質(zhì)量分別進(jìn)行了一元及多元線性回歸,得出較優(yōu)體積模型為V=-7.21+2.41x4,較優(yōu)質(zhì)量模型為m=-54.31+5.32x3。并將模型計(jì)算值與測(cè)量值進(jìn)行了比較,得出模型體積預(yù)測(cè)值、質(zhì)量預(yù)測(cè)值與測(cè)量值比較的平均相對(duì)誤差分別為4.94%、6.52%。對(duì)于其他品種砂糖橘的體積及質(zhì)量模型還需進(jìn)一步驗(yàn)證。