蔣偉+王運(yùn)祥+張巍
摘要:以7成熟、9成熟和過(guò)熟3種不同成熟度的哈密瓜為研究對(duì)象,在Matlab 7.6環(huán)境下,先利用圖像處理技術(shù)對(duì)哈密瓜果臍處進(jìn)行背景圖像分割,計(jì)算圖像的最大值、最小值、平均值等7個(gè)特征值,然后運(yùn)用模式識(shí)別與回歸工具箱LibSVM建立基于支持向量機(jī)(support vector machine,SVM)的哈密瓜成熟度分類(lèi)模型,并對(duì)分類(lèi)準(zhǔn)確率進(jìn)行預(yù)測(cè)。結(jié)果表明,圖像處理中的LibSVM工具箱可以很好地運(yùn)用到哈密瓜成熟度的無(wú)損檢測(cè)研究中,模型分類(lèi)準(zhǔn)確率可達(dá)到95.83%。
關(guān)鍵詞:哈密瓜;圖像處理;成熟度;無(wú)損檢測(cè);LibSVM;模型;準(zhǔn)確率
中圖分類(lèi)號(hào): TS207 文獻(xiàn)標(biāo)志碼: A
文章編號(hào):1002-1302(2016)11-0396-03
新疆素有“瓜果之鄉(xiāng)”的美稱(chēng),目前新疆水果種植總面積已達(dá)到991 719 hm2。2012年林果總產(chǎn)量超過(guò)650多萬(wàn)t,年產(chǎn)值近300億元[1],2013年林果總產(chǎn)量達(dá)1 326.9萬(wàn)t[2],發(fā)展非常迅猛。林果業(yè)已經(jīng)成為新疆農(nóng)民脫貧致富的重要途徑。
隨著科學(xué)技術(shù)的不斷發(fā)展與進(jìn)步,信息技術(shù)在農(nóng)產(chǎn)品加工處理上的運(yùn)用已經(jīng)成為當(dāng)今農(nóng)業(yè)可持續(xù)發(fā)展的一項(xiàng)重要手段。近年來(lái),國(guó)內(nèi)外眾多專(zhuān)家與學(xué)者采用圖像、光譜、氣味等無(wú)損性方法對(duì)水果品質(zhì)檢測(cè)進(jìn)行了大量研究。應(yīng)義斌等用顏色特性對(duì)柑橘成熟度進(jìn)行了無(wú)損檢測(cè)研究,在波長(zhǎng)700 nm光譜處得到了高質(zhì)量的柑橘圖像,提出了一種利用協(xié)方差矩陣和樣本屬于橘黃色和綠色的概率來(lái)判斷柑橘成熟度的判別分析法,并以實(shí)測(cè)固酸比值作為對(duì)照,對(duì)72個(gè)柑橘樣本成熟度的判別準(zhǔn)確率達(dá)到了91.67%[3]。馬本學(xué)等采用漫反射高光譜成像技術(shù)對(duì)哈密瓜糖度進(jìn)行了無(wú)損檢測(cè)研究,對(duì)比了多元散射信號(hào)修正、標(biāo)準(zhǔn)正則變換校正方法,原始光譜、一階微分、二階微分光譜預(yù)處理方法對(duì)建模精度的影響;采用偏最小二乘法(partial least squares,PLS)、逐步多元線性回歸(multiple linear stepwise regression,SMLR)和主成分回歸方法對(duì)比了帶皮哈密瓜和去皮哈密瓜糖度檢測(cè)模型效果。結(jié)果表明,應(yīng)用SMLR法檢測(cè)去皮哈密瓜糖度效果最佳,校正集相關(guān)系數(shù)為0.928,預(yù)測(cè)均方差為0.458,預(yù)測(cè)集相關(guān)系數(shù)為0.818,校正均方差為0.727[4]。宋小青等利用電子鼻技術(shù)快速無(wú)損檢測(cè)低溫貯藏獼猴桃芳香氣味的變化,分別采用偏最小二乘法、多元線性回歸(multivariable linear regression,MLR)和反向傳播算法(back propagation,BP)網(wǎng)絡(luò)建立了評(píng)價(jià)獼猴桃可溶性固形物含量(soluble solid content,SSC)、硬度、pH值的數(shù)學(xué)模型,研究表明線性判別式分析(linear discriminant analysis,LDA)比主成分分析(principal component analysis,PCA)方法能更好地識(shí)別不同貯藏時(shí)間的獼猴桃,BP網(wǎng)絡(luò)預(yù)測(cè)能力高于MLR方法,MLR方法的分析精度優(yōu)于PLS。其中BP網(wǎng)絡(luò)的測(cè)試集SSC、硬度、pH值的預(yù)測(cè)值和測(cè)試值的R2分別為0.93、0.90、0.90,相應(yīng)的校正均方差分別為0.48、2.15、0.08[5]。Morrison等指出由于大多數(shù)水果成分復(fù)雜且不均勻,使超聲波對(duì)水果品質(zhì)檢測(cè)很難成功,從而提出了一種新超聲波方法,通過(guò)分析水果邊界的反射情況來(lái)整體評(píng)估水果品質(zhì),發(fā)現(xiàn)超聲波與臍橙的密度有高度相關(guān)性,可以無(wú)損預(yù)測(cè)相對(duì)含水率,同時(shí)不受水果大小、成熟度等物理特性的影響。通過(guò)9 d對(duì)1個(gè)臍橙的跟蹤研究,發(fā)現(xiàn)超聲波與堅(jiān)實(shí)度高度相關(guān)[6]。雖然目前國(guó)內(nèi)外學(xué)者對(duì)哈密瓜成熟度檢測(cè)技術(shù)缺乏深入地研究,且絕大多數(shù)研究仍停留在實(shí)驗(yàn)室研究階段。特別是作為新疆特產(chǎn)的哈密瓜,對(duì)它的成熟度檢測(cè)尚屬空白,但國(guó)內(nèi)外水果成熟度檢測(cè)技術(shù)對(duì)本研究具有一定的借鑒和移植性。
圖像處理大體上可分為圖像的像質(zhì)改善、分析、重建三大部分[7],本研究?jī)?nèi)容屬于圖像分析范疇。首先對(duì)哈密瓜特征進(jìn)行提取說(shuō)明,然后對(duì)特征數(shù)據(jù)進(jìn)行歸一化預(yù)處理,并以哈密瓜果臍處圖像為研究對(duì)象,通過(guò)文中處理方法達(dá)到識(shí)別分類(lèi)的目的。
1 哈密瓜特征的提取
特征提取前要對(duì)圖像進(jìn)行背景分割[8]處理,剔除影響特征參數(shù)的背景因素。圖像的描述性統(tǒng)計(jì)量有平均值、標(biāo)準(zhǔn)差、最大值、最小值、極差、中位數(shù)、眾數(shù)、變異系數(shù)、偏度、峰度和熵[9],其中變異系數(shù)是衡量資料中各觀測(cè)值變異程度的一個(gè)統(tǒng)計(jì)量,計(jì)算公式為變異系數(shù)=(標(biāo)準(zhǔn)偏差/平均值)×100%。由于變異系數(shù)進(jìn)行的是2個(gè)或多個(gè)資料(如價(jià)格和轉(zhuǎn)速等單位不一)變異程度的比較,單位相同時(shí)用標(biāo)準(zhǔn)差比較,所以不考慮變異系數(shù)。背景分割前、后的圖像如圖1、圖2所示,峰度和熵的分布如圖3、圖4所示。
3 試驗(yàn)設(shè)計(jì)與結(jié)果分析
3.1 試驗(yàn)設(shè)計(jì)
首先,將采購(gòu)來(lái)的哈密瓜分為7成熟、9成熟和過(guò)熟3類(lèi),然后用奧林巴斯數(shù)碼照相機(jī)獲取哈密瓜7成熟、9成熟和過(guò)熟果臍處圖像各28張,圖片分辨率為3648×2736。從所得圖像中分別選取20張,共計(jì)60個(gè)作為訓(xùn)練樣本,其余的24個(gè)作為測(cè)試樣本。令訓(xùn)練樣本中與7成熟、9成熟和過(guò)熟相對(duì)應(yīng)的標(biāo)簽分別為1、2、3。通過(guò)模式識(shí)別與回歸工具箱LibSVM建立基于SVM[11-14]的哈密瓜成熟度分類(lèi)模型,利用該模型處理分析測(cè)試樣本集,得到樣本測(cè)試標(biāo)簽。將實(shí)際標(biāo)簽與測(cè)試標(biāo)簽進(jìn)行對(duì)比,得出分類(lèi)的準(zhǔn)確率。
本試驗(yàn)采用3種不同的處理方法對(duì)訓(xùn)練集樣本特征數(shù)據(jù)進(jìn)行預(yù)處理,即對(duì)數(shù)據(jù)進(jìn)行[-1,1]、[0,1]的歸一化預(yù)處理以及不進(jìn)行歸一化預(yù)處理,最后對(duì)測(cè)試集樣本的預(yù)測(cè)分類(lèi)結(jié)果的準(zhǔn)確率進(jìn)行對(duì)比分析,得出結(jié)論。
3.2 結(jié)果分析
對(duì)哈密瓜訓(xùn)練集樣本的特征數(shù)據(jù)進(jìn)行3種不同的預(yù)處理,即進(jìn)行[-1,1]、[0,1]的歸一化預(yù)處理以及不進(jìn)行歸一化預(yù)處理,其中Svmtrain的參數(shù)選項(xiàng)都采用“懲罰因子c=2、RBF核函數(shù)中的Gamma值g=0.07”,所得的Matlab圖像如圖5至圖7所示。
從圖5至圖7中可以看出,對(duì)哈密瓜訓(xùn)練集樣本的特征數(shù)據(jù)進(jìn)行的3種不同預(yù)處理方法,都可以將哈密瓜7成熟、9成熟和過(guò)熟3類(lèi)不同成熟度區(qū)分,但它們的分類(lèi)準(zhǔn)確率有所不同,具體如表1所示。
從表1可以看出,對(duì)訓(xùn)練集樣本特征數(shù)據(jù)進(jìn)行[0,1]的歸一化預(yù)處理的分類(lèi)準(zhǔn)確率最高, 不進(jìn)行歸一化預(yù)處理的分類(lèi)準(zhǔn)確率次之,[-1,1]的歸一化預(yù)處理的分類(lèi)準(zhǔn)確率最低。
4 結(jié)論
本研究分析了在哈密瓜成熟度識(shí)別分類(lèi)中Matlab圖像處理技術(shù)的運(yùn)用,對(duì)提取的特征數(shù)據(jù)進(jìn)行不同的預(yù)處理,得到不同的分類(lèi)準(zhǔn)確率。其中,未進(jìn)行歸一化預(yù)處理的分類(lèi)準(zhǔn)確率并不是最低的,可見(jiàn)并不是任何問(wèn)題都必須事先把原數(shù)據(jù)進(jìn)行歸一化。針對(duì)哈密瓜成熟度分類(lèi)問(wèn)題,[0,1]的歸一化預(yù)處理方法達(dá)到了很好的分類(lèi)效果??梢?jiàn),基于模式識(shí)別與回歸工具箱LibSVM建立的哈密瓜成熟度分類(lèi)模型對(duì)哈密瓜進(jìn)行分類(lèi)的無(wú)損檢測(cè)技術(shù)是可行的,并對(duì)大型水果上應(yīng)用無(wú)損檢測(cè)技術(shù)提供借鑒和參考。
參考文獻(xiàn):
[1]新疆維吾爾自治區(qū)統(tǒng)計(jì)局. 新疆統(tǒng)計(jì)年鑒[M]. 北京:中國(guó)統(tǒng)計(jì)出版社,2013.
[2]新疆維吾爾自治區(qū)統(tǒng)計(jì)局. 新疆統(tǒng)計(jì)年鑒[M]. 北京:中國(guó)統(tǒng)計(jì)出版社,2014.
[3]應(yīng)義斌,饒秀勤,馬俊福. 柑橘成熟度機(jī)器視覺(jué)無(wú)損檢測(cè)方法研究[J]. 農(nóng)業(yè)工程學(xué)報(bào),2004,20(2):144-147.
[4]馬本學(xué),肖文東,祁想想,等. 基于漫反射高光譜成像技術(shù)的哈密瓜糖度無(wú)損檢測(cè)研究[J]. 光譜學(xué)與光譜分析,2012,32(11):3093-3097.
[5]宋小青,任亞梅,張艷宜,等. 電子鼻對(duì)低溫貯藏獼猴桃品質(zhì)的預(yù)測(cè)[J]. 食品科學(xué),2014,35(20):230-235.
[6]Morrison D S,Abeyratne U R. Ultrasonic technique for non-destructive quality evaluation of oranges[J]. Journal of Food Engineering,2014,141:107-112.
[7]楊 杰. 數(shù)字圖像處理及MATLAB實(shí)現(xiàn)[M]. 北京:電子工業(yè)出版社,2010.
[8]王紅君,陳 偉,趙 輝,等. 復(fù)雜背景下植物葉片的彩色圖像分割[J]. 中國(guó)農(nóng)機(jī)化學(xué)報(bào),2013,34(2):207-211.
[9]謝中華. MATLAB統(tǒng)計(jì)分析與應(yīng)用:40個(gè)案例分析[M]. 北京:北京航空航天大學(xué)出版社,2010.
[10]史 峰,王小川,郁 磊,等. MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M]. 北京:北京航空航天大學(xué)出版社,2010.
[11]Chang C C,Lin C J. LIBSVM:a library for support vector machines[J]. ACM Transactions on Intelligent Systems and Technology,2011,2(3):27.
[12]Hsu C W,Lin C J. A comparison of methods for multi-class support vector machines[J]. IEEE Transactions on Neural Network,2002,13(2):415-425.
[13]Horvath D,Brown J B,Marcou G,et al. An evolutionary optimizer of libsvm models[J]. Challenges,2014,5(2):450-472.
[14]Pouladzadeh P,Shirmohammadi S,Bakirov A,et al. Cloud-based SVM for food categorization[J]. Multimedia Tools and Applications,2015,74(14):5243-5260.