• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于隨機森林算法的黃瓜種子腔圖像分割方法

    2017-12-16 10:01:22張經(jīng)緯黃亦翔劉成良龔霽程潘俊松
    農(nóng)機化研究 2017年10期
    關(guān)鍵詞:識別率果肉紋理

    張經(jīng)緯,貢 亮,黃亦翔,劉成良,龔霽程,潘俊松

    (上海交通大學(xué) a.機械與動力工程學(xué)院;b.農(nóng)業(yè)與生物學(xué)院,上海 200240)

    ?

    基于隨機森林算法的黃瓜種子腔圖像分割方法

    張經(jīng)緯a,貢 亮a,黃亦翔a,劉成良a,龔霽程a,潘俊松b

    (上海交通大學(xué) a.機械與動力工程學(xué)院;b.農(nóng)業(yè)與生物學(xué)院,上海 200240)

    針對黃瓜表型測量中圖像識別問題,為解決黃瓜種子腔與果肉圖像灰度差別不大情況下的分割難題,提出了基于隨機森林算法(Random Forest, RF)的黃瓜種子腔圖像分割方法。首先,通過顏色空間變換,提取樣本在RGB、HSV、YCbCr模型下的9個顏色分量;接著,基于灰度共生矩陣提取樣本的能量、熵、對比度、相關(guān)性的均值與標(biāo)準(zhǔn)差等8個紋理特征。結(jié)合紋理與顏色特征,運用隨機森林算法構(gòu)建像素分類器,實現(xiàn)了種子腔的粗分割。為了提高分割質(zhì)量,對粗分割的圖像進行形態(tài)學(xué)處理得到最終分割圖像。最后,與K-均值聚類(K-means)算法、支持向量機(Support Vector Machine ,SVM)算法做對比。實驗表明:隨機森林分割算法正確識別率高達95%,錯誤識別率在10%之內(nèi),處理時間1.6 s左右,分割質(zhì)量上優(yōu)于其它兩種算法。

    黃瓜;育種;圖像分割;隨機森林;K-均值聚類;支持向量機

    0 引言

    黃瓜是我國主栽蔬菜作物之一,在保護地生產(chǎn)中具有高效益。黃瓜品質(zhì)的好壞不僅影響到鮮食的價值,而且也影響商品的經(jīng)濟效益。與瓜長、瓜粗、果色等黃瓜外觀品質(zhì)性狀相似,種子腔也是黃瓜表型檢測的重要指標(biāo),決定瓜把長度與果肉厚度。測量黃瓜種子腔相關(guān)參數(shù),構(gòu)建基因型-表型圖譜,對于黃瓜優(yōu)質(zhì)品種培育意義重大[1]。

    傳統(tǒng)的表型檢測依賴人工測量,效率低、盲目性大、勞動密集,主要靠手工與經(jīng)驗,存在許多的不足。近些年,基于機器視覺的表型觀測平臺興起,解決了表型手工測量隨機性強、主觀偏差大及工作效率低的瓶頸問題。

    常用的果實圖像分割與識別方法有兩類:一類是基于顏色、紋理等特征的閾值分割,如胡嬋莉等[2]采用色差法分割識別蘋果;李二超等[3]使用顏色與紋理結(jié)合的閾值分割算法識別黃瓜。閾值分割算法簡單、快捷,但僅適合分割待測區(qū)域與背景差別較大的圖像。黃瓜種子腔與果肉差別并不明顯,僅依靠簡單的顏色分割與紋理分割,難以取得滿意效果。另一類是基于模式識別的方法,需要用到各種分類器。如司永勝等[4]使用基于顏色與紋理特征的k-means算法實現(xiàn)了綠色蘋果的識別;王海清等[5]提取幾何特征與紋理特征,利用SVM算法實現(xiàn)黃瓜的分割。K-means聚類算法是一種無監(jiān)督的分類算法,對初始值與噪聲十分敏感。SVM算法是一種有監(jiān)督的分類算法,不適合處理大規(guī)模訓(xùn)練數(shù)據(jù)樣本。

    隨機森林(Random Forest ,RF)是一種集成學(xué)習(xí)方法,2001年由 Breiman提出[6],并迅速成為機器學(xué)習(xí)領(lǐng)域的新的研究熱點。隨機森林可以處理高維數(shù)據(jù),預(yù)測精度高,訓(xùn)練速度快[7]。近些年,隨機森林算法被廣泛運用于醫(yī)學(xué)圖像處理、遙感圖像分析[8]及城市測繪分類等領(lǐng)域。

    本文基于結(jié)構(gòu)化環(huán)境下黃瓜的顏色與紋理特征,利用隨機森林法對黃瓜種子腔進行了分割,有效解決了種子腔與果肉顏色相似情況下的識別難題。

    1 顏色空間分析與特征提取

    1.1 HSV顏色空間

    在彩色圖像處理中,RGB顏色模型應(yīng)用廣泛。RGB模型把所有顏色看作是紅、綠、藍三基色的組合,3個顏色分量之間高度相關(guān),所以易受光照變化等環(huán)境因素干擾。HSV顏色模型重新映射了RGB模型。其中,H代表色相 (Hue)、S代表飽和度 (Saturation)、V代表明度(Value)。H、S分量可以消除亮度信息的影響,比RGB空間有很大的優(yōu)越性??紤]本研究中由于光照不均勻,黃瓜周圍會產(chǎn)生陰影,影響黃瓜的分割效果,故可采用S通道抑制陰影。同時,利用S通道分割黃瓜與背景,形成模板去除背景,提高處理效率。

    1.2 YCbCr顏色空間

    YCbCr是一種基于人眼感知的顏色空間,常用于優(yōu)化彩色視頻信號。與HSV類似,YCbCr適用于光照變化的場合。其中,Y表示明視度(Luminance);Cb和Cr兩個分量表示色調(diào)(Chrominance)。相比于HSV的非線性,YCbCr 顏色空間是RGB的線性變化,因此空間坐標(biāo)表達形式比較簡單,不存在信息丟失問題,有較高的運算效率,廣泛應(yīng)用于果蔬的分割與識別研究。在本研究中,由于Y通道種子腔與果肉對比度較大,因此采用Y通道來提取黃瓜的紋理特征。

    1.3 圖像特點分析

    選取45幅實驗室結(jié)構(gòu)化環(huán)境下剖開的黃瓜圖像,在每一幅圖像上任意選取6個樣本像素點,種子腔與果肉各3個。根據(jù)135組樣本數(shù)據(jù),繪制種子腔與果肉H、S、V、Y、Cb、Cr、R、G、B等9個顏色通道的對比圖。圖1顯示了其中3個顏色通道的像素點灰度分布。在HSV顏色空間的S通道中,果肉的像素灰度值比種子腔偏大,但差別不明顯;在YCrCb顏色空間的Y通道中,種子腔的像素灰度值比果肉更大且集中,但仍難以找到合適的分割閾值。直觀上,黃瓜整體偏綠,種子腔和果肉顏色深淺有所差別,但是在RGB模型的G通道,種子腔和果肉像素點重合區(qū)域較大。除此之外,在其余的6個顏色通道,種子腔與果肉的樣本像素灰度值都有重疊,依靠單一通道單一閾值難以進行有效分割。因此,顏色特征需與其他特征如紋理特征相結(jié)合。

    食品產(chǎn)業(yè)在近年來得到了迅速的發(fā)展,在成績背后,除了業(yè)界不斷推動新品銷售之外,還有另外一個重要的原因——行業(yè)內(nèi)緊跟年輕消費者的需求,從包裝的材質(zhì)、外觀甚至店鋪整體銷售環(huán)境上做出了升級。

    圖1 樣本像素點的灰度

    2 紋理特征提取

    通常來說,圖像的紋理特征指圖像顏色或灰度級的分布與變化與顏色特征類似,紋理特征是反映圖像性質(zhì)的重要特征。在眾多紋理特征提取方法中,基于統(tǒng)計算法的灰度共生矩陣[9]廣受歡迎。該矩陣通過計算距離相距為l、方向相距為θ的兩個像素灰度級的二階聯(lián)合條件概率密度P(i,j|l,θ)獲得。其中,重要的參數(shù)包括能量、熵、對比度及相關(guān)性等。

    在本研究中,黃瓜種子腔與果肉間紋理特征差別較大。為了提高分割的準(zhǔn)確性,本文采取重疊窗口的方法獲取黃瓜的局部紋理特征。即以目標(biāo)像素為中心創(chuàng)造一個9×9的窗口,以窗口內(nèi)所有像素構(gòu)建灰度共生矩陣,獲取能量、熵、對比度,以及相關(guān)性的均值μ1、μ2、μ3、μ4和標(biāo)準(zhǔn)差σ1、σ2、σ3、σ4,作為目標(biāo)像素的紋理特征,直到所有黃瓜像素點遍歷完畢。

    3 黃瓜種子腔的識別與分割

    3.1 隨機森林法

    決策樹預(yù)測先從決策點開始,不斷對分類的屬性測試,根據(jù)屬性值選擇輸出分支,到達結(jié)果節(jié)點,實現(xiàn)分類[10]。

    隨機森林法是以決策樹為基預(yù)測器的組合分類模型。決策樹模型表示為{h(X,Lk),k=1,...} 。其中,X代表輸入向量;{Lk}是獨立同分布的隨機向量,用于控制樹的生長。隨機森林先利用bootstrap從原始訓(xùn)練集抽取k個樣本,并建立k個決策樹模型,從而形成分類模型序列{h1(X,L1),h2(X,L2),...hk(X,Lk)}。在給定的自變量X下,每個決策樹會預(yù)測一個結(jié)果。對分類問題,隨機森林的預(yù)測結(jié)果取決于各個決策樹結(jié)果的簡單多數(shù)投票。其公式為[11]

    (1)

    其中,H(x)為隨機森林分類模型;C為分類的標(biāo)簽;I(x) 為示性函數(shù)。

    隨機森林解決了決策樹創(chuàng)建不穩(wěn)定、過擬合等問題,在分類精度上比單株的決策樹有明顯的提高。此外,與其他主流分類算法比較,隨機森林具有能夠處理高維數(shù)據(jù)及分類速度快等特點。

    3.2 形態(tài)學(xué)處理

    對隨機森林初步分割過的黃瓜圖像進行二值化處理,圖像中仍然殘留一定的噪聲。總的來看,噪聲分為粘連噪聲與孤立噪聲。其中,粘連噪聲主要存在于種子腔邊界,這些交界處顏色相近、紋理特征不明顯。因此,需要使用多種形態(tài)學(xué)處理方法消除噪聲,提高分割精度。

    孤立噪聲可通過交替使用開閉運算進行形態(tài)學(xué)濾波來消除。對內(nèi)部較大的孔洞,形態(tài)學(xué)濾波難以處理??紤]到黃瓜種子腔是一塊完整的區(qū)域,可以采用孔洞填充操作處理。對面積較大的噪聲,則需要使用閾值面積消除法,去除面積小于一定閾值的區(qū)域。在本研究中,由于黃瓜邊緣顏色與籽粒相近,紋理特征也受到影響,部分區(qū)域孤立噪聲較大,使用閾值面積消除法可以有效解決。

    4 實驗結(jié)果與分析

    實驗選取的黃瓜樣本(15CP-3)取自國家設(shè)施農(nóng)業(yè)工程技術(shù)研究中心崇明島基地,剖開后在暗箱中進行圖像采集。采集所用的相機為中國大恒公司生產(chǎn)的MER-500-7UC型數(shù)字攝像機,圖像的分辨率為600像素×800像素。實驗軟件基于matlab R2015a,計算機的配置為處理器Intel(R) i5-4200U @1.60Hz,內(nèi)存4GB,硬盤500GB。

    選取45張剖開的黃瓜圖像,35張做訓(xùn)練樣本,10張作測試樣本,每張訓(xùn)練樣本選取320個代表像素點,按照圖2所示的算法流程進行處理。選取黃瓜圖像的H、S、V、Y、Cb、Cr、R、G、B等9個顏色特征,以及能量、熵、對比度、相關(guān)性的均值μ1、μ2、μ3、μ4和標(biāo)準(zhǔn)差σ1、σ2、σ3、σ4等8個紋理特征,歸一化處理后,使用RF算法進行處理。為了直觀表述分割效果,采用基于區(qū)域的分割評價方法[12],定義正確識別率為預(yù)測結(jié)果中確實屬于種子腔的像素數(shù)量與真實種子腔總像素數(shù)量的比值。錯誤識別率為將果肉誤分割為種子腔的像素數(shù)量與真實果肉像素數(shù)的比例。

    分類樹數(shù)目是RF的一個重要參數(shù)。一般來說,隨著分類樹數(shù)目增多,正確識別率升高,錯誤識別率降低直至收斂,同時預(yù)測時間增多。對文中訓(xùn)練集的同一黃瓜圖像,以50棵為間隔,選取350~800棵分類樹進行測試。不同的分類樹數(shù)目對正確識別率和錯誤識別率有一定的影響,但是差別不大,預(yù)測時間都在1.1~2.7s之間。綜合考慮,可以選擇常用的默認分類樹數(shù)量(即500棵),正確識別率為89.67%,錯誤識別率為17.19%,預(yù)測時間為1.6s。

    圖2 黃瓜種子腔分割算法框圖

    為了更好地表示分割結(jié)果,對于RF算法初步分割的測試集中的黃瓜圖像進行后續(xù)形態(tài)學(xué)處理,處理結(jié)果如表1所示。分析數(shù)據(jù)可知:黃瓜初步分割的平均正確識別率為90.53%,錯誤識別率為19.41%,處理時間為1.6 s。經(jīng)過后續(xù)形態(tài)學(xué)處理后,平均正確識別率為95.55%,錯誤識別率為9.94%??梢钥闯觯赫_識別率有了很大的提高,而錯誤識別率控制在10%之內(nèi),分割效果較為理想。

    為了顯示本文方法的優(yōu)越性,對同樣的測試集選取常用的K-means和SVM算法進行分割對比實驗。K-means是無監(jiān)督的分類器,具有簡潔、快速的特點。使用模板去除背景后,對測試集圖片每個像素點提取17個顏色和紋理特征并聚類成種子腔與果肉兩類。SVM是有監(jiān)督的分類器,有較好的魯棒性,適合小樣本學(xué)習(xí)[13]。數(shù)量較多或者特征維數(shù)較多時,SVM的訓(xùn)練與預(yù)測時間會顯著增加。因此,本文先使用relief算法對樣本集進行特征選擇。由實驗可知:明度V、能量均值μ1、能量標(biāo)準(zhǔn)差σ1和對比度標(biāo)準(zhǔn)差σ3為影響最大的4個特征。從前文訓(xùn)練集中隨機選取3 000個帶有4個選取特征的像素點作為新的訓(xùn)練集,采用徑向基核函數(shù),由交叉驗證法獲得核函數(shù)參數(shù)σ2為4,懲罰參數(shù)C為1.52。圖3為3種算法的分割效果圖,樣本取自測試集。其中,種子腔的像素為白色,果肉與背景的像素為黑色??梢钥闯?,經(jīng)過3種算法初歩分割及后續(xù)形態(tài)學(xué)處理后,種子腔區(qū)域被較為完整地分割出來,但不同算法的分割效果有很大的差異。其中,后兩種算法分割的區(qū)域與種子腔實際面積相比較大。表2為K-means和SVM算法對測試集的具體處理結(jié)果。結(jié)合表1可知:在3種算法中,K-means算法分割的種子腔正確識別率最高,基本可以達到100%,但是存在嚴重的過分割問題,其錯誤識別率在40%左右。究其原因,果肉部分顏色分布區(qū)間差異較大,靠近種子腔區(qū)域的淺綠色果肉顏色上更接近種子腔,紋理特征不明顯,被誤分割為種子腔。此外,在實驗過程中,K-means算法不穩(wěn)定,其性能依賴于聚類中心的初始位置,識別率和運行時間受到很大影響。作為有監(jiān)督的分類器,SVM分割效果較K-means有很大提高。但是,從表3中可以看出:樣本7的分割效果極差。相對于其他樣本,樣本7的黃瓜水分較少,種子腔部分整體偏暗,種子腔下半部的紋理特征不明顯。除去樣本7,SVM分割種子腔的正確識別率為94.17%,錯誤識別率為22.36%,誤分割區(qū)域還是較多。在處理時間方面,K-means算法具有很大的優(yōu)勢,平均在0.4 s左右,但是存在不穩(wěn)定的問題。相對于無監(jiān)督的K-means算法,RF和SVM算法的預(yù)測時間略長,分別在1.6 s和2.3 s左右。RF算法處理速度優(yōu)于SVM算法,不需要像SVM算法一樣進行特征選取預(yù)處理,簡單高效。

    表1 基于Random Forest算法的分割效果

    圖3 分割效果圖

    圖片序號K-means正確識別率/%K-means錯誤識別率/%處理時間/ms處理后正確識別率/%處理后錯誤識別率/%SVM正確識別率/%SVM錯誤識別率/%處理時間/ms處理后的正確識別率/%處理后的錯誤識別率/%199.2746.58378.3100.0043.3493.7625.74263599.9327.31398.0742.56493.7100.0044.4863.0920.13240078.9918.43398.6040.98351.1100.0036.9895.5022.67233798.2822.00498.4544.91483.3100.0042.2187.7826.24297693.4025.80599.2441.00464.9100.0038.0392.1219.72232898.8819.62697.6748.70379.2100.0046.7888.4829.32268196.6130.05797.5439.72303.6100.0037.5533.133.42207733.332.63890.3341.35337.399.9838.3683.6419.34189392.0419.00997.4946.46357.5100.0041.7981.5618.48204189.7515.781099.4747.78300.4100.0040.8995.4923.16178599.6623.27

    5 結(jié)論

    1)針對結(jié)構(gòu)化環(huán)境下黃瓜種子腔的分割問題,在提取黃瓜顏色與紋理特征的基礎(chǔ)上,提出了基于隨機森林的種子腔分割方法。與K-means和SVM算法進行對比,RF算法處理的種子腔錯誤識別率遠遠低于其它兩種算法,控制在10%之內(nèi)。在正確識別率方面,RF算法達到95%以上,僅次于嚴重過分割的K-means算法。綜合所述,RF算法的種子腔分割質(zhì)量優(yōu)于其它兩種算法。

    2)經(jīng)過實驗驗證表明,RF分割算法的處理時間為1.6s左右,滿足測量平臺對種子腔大批量、快速測量的要求。

    3)與SVM相比,RF分割算法不需要進行特征的選擇,能夠高效地處理大數(shù)據(jù)量的樣本;但考慮到處理時間和分割質(zhì)量,還需要在有限的樣本中尋找有明顯作用的特征。

    [1] FURBANKR T, TESTER M. Phenomics-technologies to relieve the phenotyping bottleneck [J].Trends in plant science, 2011, 16(12):635-644.

    [2] 胡嬋莉, 趙德安, 趙宇艷, 等. 基于極值的重疊蘋果識別方法研究[J]. 農(nóng)機化研究, 2016,38(3):42-46.

    [3] 李二超, 李戰(zhàn)明, 劉微容. 基于顏色和紋理特征的黃瓜果實圖像分割[J]. 光學(xué)技術(shù), 2009,35(4):529-531.

    [4] 司永勝, 劉剛, 高瑞. 基于 K-均值聚類的綠色蘋果識別技術(shù)[J]. 農(nóng)業(yè)機械學(xué)報, 2009 (S1):100-104.

    [5] 王海青, 姬長英, 顧寶興, 等. 基于機器視覺和支持向量機的溫室黃瓜識別[J]. 農(nóng)業(yè)機械學(xué)報, 2012, 43(3): 163-167.

    [6] BREIMAN, L. Random Forests [J]. Machine Learning,2001,45:5-32.

    [7] BIAU G. Analysis of a random forests model [J]. The Journal of Machine Learning Research, 2012,13(1):1063-1095.

    [8] PAL M. Random forest classifier for remote sensing classification [J]. International Journal of Remote Sensing, 2005, 26(1):217-222.

    [9] Tien C L, Lyu Y R. Optical surface flatness recognized by discrete wavelet transform and grey level co-occurrence matrix [J].Measurement Science and Technology, 2006, 17(8): 2299.

    [10] Mingers J. An empirical comparison of selection measures for decision-tree induction[J].Machine learning, 1989, 3(4):319-342.

    [11] 方匡南, 吳見彬, 朱建平, 等. 隨機森林方法研究綜述[J].統(tǒng)計與信息論壇, 2012, 26(3): 32-38.

    [12] 張石, 董建威, 佘黎煌. 醫(yī)學(xué)圖像分割算法的評價方法[J].中國圖象圖形學(xué)報, 2009, 14(9):1872-1880.

    [13] 李侃, 黃文雄, 黃忠華. 基于支持向量機的多傳感器探測目標(biāo)分類方法[J]. 浙江大學(xué)學(xué)報: 工學(xué)版, 2013(1):15-22.

    Image Segmentation of Cucumber Seed Cavity Based on the Random Forest Algorithm

    Zhang Jingweia, Gong Lianga, Huang Yixianga, Liu Chenglianga, Gong Jichenga, Pan Junsongb

    (a.School of Mechanical Engineering; b.School of Agriculture and Biology, Shanghai Jiao Tong University, Shanghai 200240, China)

    For identifying regions of interest in the measurement of cucumber phenotype, the segmentation of cucumber seed cavity is difficult because the gray scale difference between cucumber seed cavity and flesh is not obvious. A method based on the Random Forest (RF) algorithm for image segmentation of cucumber seed cavity was proposed. First, 9 color features were taken from 3 color spaces including RGB, HSV and YCbCr. Then 8 texture features which are composed of means and standard deviations of angular second moment, entropy, contrast and correlation based on Gray-level Co-occurrence Matrix were extracted. All color and texture features were brought into the training module of Random Forest to make an image classifier which can be used for coarse segmentation of cucumber seed cavity. Morphological processing was introduced to improve the segmentation quality. Finally, the method mentioned above was compared with the K-means clustering (K-means) algorithm and the Support Vector Machine (SVM) algorithm. The test results show that the rate of right identification is up to 95% or more, the rate of false identification is less than 10% and the recognition time is about 1.6 s by using the Random Forest algorithm for cucumber seed cavity segmentation, which is superior to the other two algorithms.

    cucumber; breeding; image segmentation;random forest; K-means clustering; support vector machine

    2016-10-19

    “十二五”國家科技支撐計劃項目(2014BAD08B01);上海交通大學(xué)“Agri+X”基金項目(Agri-X2015002)

    張經(jīng)緯(1991-),男,江蘇徐州人,碩士研究生,(E-mail)zhangjingwei19918@163.com。

    劉成良(1964-),男,山東臨沂人,教授,博士,(E-mail)chlliu@sjtu.edu.cn。

    TP391.41;S603.6

    A

    1003-188X(2017)10-0163-06

    猜你喜歡
    識別率果肉紋理
    基于BM3D的復(fù)雜紋理區(qū)域圖像去噪
    軟件(2020年3期)2020-04-20 01:45:18
    基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測
    計算機工程(2020年3期)2020-03-19 12:24:50
    My Favourite Fruit
    基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識別率的關(guān)系
    秋天的禮物
    使用紋理疊加添加藝術(shù)畫特效
    提升高速公路MTC二次抓拍車牌識別率方案研究
    TEXTURE ON TEXTURE質(zhì)地上的紋理
    Coco薇(2017年8期)2017-08-03 15:23:38
    “萌萌”的 火 龍 果 盆栽
    高速公路機電日常維護中車牌識別率分析系統(tǒng)的應(yīng)用
    黔西| 米易县| 陈巴尔虎旗| 云霄县| 洱源县| 香港 | 专栏| 土默特右旗| 孝昌县| 红桥区| 龙泉市| 永川市| 奉新县| 泰和县| 自治县| 桐柏县| 新兴县| 盘锦市| 曲靖市| 昆山市| 河曲县| 宁陵县| 马边| 兴化市| 崇礼县| 水城县| 徐汇区| 五常市| 五大连池市| 彰武县| 高碑店市| 临汾市| 微山县| 武平县| 上蔡县| 辽源市| 平泉县| SHOW| 东乌珠穆沁旗| 微山县| 乳山市|