趙嘉瑋
(武警甘肅省總隊,甘肅 蘭州 730000)
我國是草莓生產(chǎn)和栽培面積最大的國家,針對草莓分類工作存在漏檢率高、精準度低和草莓品相、顏色、飽滿度容易忽略的問題,本研究在日本宮崎縣草莓上市標準的基礎(chǔ)上,結(jié)合草莓果實的周長、面積、形狀、顏色、成熟度特征,對草莓等級進行分類。
本研究對中國農(nóng)業(yè)網(wǎng)草莓數(shù)據(jù)和實拍補充的500張草莓實體圖進行圖像預處理,并對預處理的圖像進行目標分割及特征提取,主要目的是提取形狀特征、顏色特征、成熟度特征。具體步驟分為3個部分。
首先,研究人員在Matlab中利用最小二乘法劃分目標區(qū)域,調(diào)用bwperim函數(shù)計算周長,利用像素點和計算有效面積,將圖像轉(zhuǎn)換為HSV坐標化圖像后,調(diào)用HSV模型對顏色成熟度和飽和度進行刻畫,利用傅里葉描繪子得到草莓形狀(飽滿度),對提取到的各特征進行加權(quán),最終將草莓劃分為特等品、一等品、二等品、不合格4個等級。
其次,研究人員利用SVM算法對提取到的草莓特征值進行逐類目標特征訓練,對目標識別出的各類特征進行分類打分,經(jīng)過加權(quán)算法最終劃分目標等級。
最后,研究人員對成果進行測試。研究人員采集新的草莓圖像,利用傳統(tǒng)的人工分類方式,對草莓進行分類,將采集圖像輸入程序與人工分類進行對比,驗證分類的準確性、魯棒性。
圖像預處理包括圖像二值化、圖像HSV坐標化圖像、圖像剪裁、目標分割與剪裁[1]。
研究人員在Matlab中調(diào)用rgb2hsv函數(shù),將 RGB 的顏色轉(zhuǎn)換為HSV坐標,即RGB的值轉(zhuǎn)化為對應(yīng)的明度、色調(diào)、飽和度坐標;利用mat2gray函數(shù)實現(xiàn)圖像歸一化,即所有在矩陣中的值為1或0;最后研究人員利用im2bw函數(shù)設(shè)置閾值(本研究閾值設(shè)置為0.6),將圖像轉(zhuǎn)變成二進制圖像。
本方法利用im2bw函數(shù)將圖像轉(zhuǎn)化為二進制圖像,通過imclose進行形態(tài)閉合,對相似像素點進行取舍,確定目標;然后利用imfill函數(shù)填充剛剛?cè)Χǖ哪繕丝祝挂汛_定像素目標中包含背景,呈多孔目標圖像,利用此函數(shù)對其進行填充,使其成為一個完整閉合的圖像;最后再次調(diào)用imcrop函數(shù)進行剪裁。
本方法獲取周長和面積的方式是在Matlab中,通過bwperim函數(shù)計算周長,通過像素點之和計算面積。圖像的預處理會使面積的計算更精確,尤其適用于不規(guī)則圖形面積的計算。
研究人員利用傅里葉描繪子對草莓形狀進行定義[2]。封閉的草莓輪廓Ω={(xi,yi),i=1,2,…,m}初始位置相同,研究人員可將其視為一個周期,利用傅里葉級數(shù)正弦波的形式展開研究。草莓輪廓Ω在復平面上的參數(shù)方程為:c(t)=x(t)+jy(t),t∈(0,2π]。曲線c(t)在(x,y)方向上的傅里葉:
(1)
曲線c(t)的傅里葉描述子為:
(2)
曲線受高頻噪聲影響,所以采用N個低頻橢圓傅里葉描述子描述草莓果形,即草莓形特征向量:FD=[FD1,F(xiàn)D2,…,F(xiàn)DN][3]。
HSV是一種直觀特性顏色模型,也叫六角椎體模型,是色調(diào)、飽和度、明度的綜合模型,用來反映所要表達事物的顏色、飽和度、成熟度的數(shù)據(jù)特征與特性[4]。
研究人員通過實驗,首先對涉及變量進行加權(quán):將變量h劃分權(quán)重9,變量s劃分權(quán)重3,變量v劃分權(quán)重1;其次進行12級量化;最后將0~2級記作Ⅰ(不合格),3~5級記作Ⅱ(二等品類),6~8級記作Ⅲ(一等品類),9~11級記作Ⅳ(特等品類)。
SVM算法又被稱為支持向量機,是一種二分類的模型,修改后可用于多類別問題的研究與分類。該算法主要解決線性與非線性兩大類問題,為找到空間內(nèi)能夠?qū)⑺蟹诸悇澐值某矫妫沟盟斜炯现械脑氐竭@個超平面的距離最短,利用該算法對提取的特征值進行訓練,以達到對其他草莓進行分類的效果。SVM算法本質(zhì)上是特征的訓練和分類,屬于機器學習。
研究人員將收集到的數(shù)據(jù)進行置亂,隨后設(shè)置訓練比,1.0為全訓,本文設(shè)置為0.8,數(shù)據(jù)集中共有500張照片,400張用來訓練,100張用來測試。
實驗運用SVM算法建立模型,首先確定核函數(shù)和懲罰參數(shù),本文選用了網(wǎng)格搜索和交叉驗證的方法,用網(wǎng)格搜索確定待定參數(shù)(г,C)的組合;再對組合進行交叉驗證來再次確認[5];最后取交叉驗證正確率最高的參數(shù)作為模型參數(shù)訓練整個SVM算法。測試結(jié)果如圖1和表1所示。
圖1 測試結(jié)果
表1 測試過程
由表1可知,特等品、一等品、二等品、不合格這4種草莓分級正確率分別為90%,78.57%,92.72%和76.19%,綜合正確率為84.37%,表明使用SVM進行形狀分級是可行的。機器視覺和圖像處理運行時間為58 m,表明該篩選方法具備實時性。
本研究在SVM算法的基礎(chǔ)上,從周長、面積、形狀、顏色、成熟度5個方面分別對草莓進行相應(yīng)的評級處理,根據(jù)加權(quán)比重,制定4個等級的草莓分級,利用邏輯運算關(guān)系串聯(lián)4個工作流程,建立一套草莓自動分級系統(tǒng)。該分級系統(tǒng)分級速度快(平均處理時間50 ms),參考因素全面,提高了人工分類的效率。利用該系統(tǒng)對100個草莓進行分級測試試驗,分級準確率達到84.37%(分類錯誤的草莓只出現(xiàn)在相鄰等級,沒有越級樣本),共耗時58 ms,可以滿足草莓實時分級的需要。