徐志杰 陳智鋒
摘 要:本文以基于移動終端的花卉識別技術(shù)為研究對象,以月季花識別為典型案例,探討了基于移動終端的花卉識別技術(shù)流程和方法,論文首先分析了花卉植物特征提取的具體方法,包括顏色特征、形狀特征、紋理特征,進(jìn)而設(shè)計(jì)了一套花卉識別系統(tǒng),在此基礎(chǔ)上,以廣州流花湖公園的20種月季花為實(shí)驗(yàn)對象,證明了系統(tǒng)識別的精度。本文是筆者在工作實(shí)踐基礎(chǔ)上的理論升華,相信對從事相關(guān)工作的同行能有所裨益。
關(guān)鍵詞:移動終端 花卉識別 特征提取 實(shí)驗(yàn)
中圖分類號:TP39 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2018)08(c)-0094-02
本文針對月季花的特性,提取月季花的底層視覺特征,利用HSV模型提取花朵顏色特征,利用CLCM和LBP融合算法提取花朵的紋理特征、銳度特征、輪廓特征、邊界特征等來確定月季花的形狀特征,共提取到月季花的22個(gè)特征;通過特征選擇算法獲取其中的18個(gè)強(qiáng)分類特征;采用RandomForest算法進(jìn)行分類和識別。經(jīng)驗(yàn)證,本文提出的基于移動端月季花快速識別方法平均識別率可達(dá)93.5%,用戶可以快速便捷地利用手機(jī)移動端進(jìn)行使用,具有不錯的識別效果和便利性,能夠?qū)Ψ菍I(yè)人士識別和鑒賞月季花起到一定的幫助。
1 花卉植物特征提取
1.1 圖像采集和預(yù)處理
本文利用華為P8手機(jī)的高清攝像頭提取花朵的清晰照片,拍攝角度需要正對花朵,將花朵置于中心位置,并且保證花朵輪廓完整且清晰,便于之后獲取花朵圖像的有效信息,減少識別誤差。獲取原始圖像之后,為了更好地提取花朵圖像信息,需要進(jìn)行預(yù)處理操作,將圖像中的花朵圖像和復(fù)雜背景分離開。首先要利用選擇框框選花朵輪廓。點(diǎn)擊右下角的按鈕,系統(tǒng)生成一個(gè)大小可變的四邊形選擇框,將花朵輪廓盡可能地圈入四邊形,然后使用顯著性檢測算法和GrabCut算法處理圖像。步驟為:首先通過圖像顯著性檢測,得到前景和背景區(qū)域并建立高斯混合模型GMM,利用K Means算法初始化GMM,將前景和背景聚為NF類和NB類;然后利用最大流最小割思想進(jìn)行圖像進(jìn)行切分,循環(huán)迭代更新GMM參數(shù),讓能量函數(shù)趨于收斂,最終實(shí)現(xiàn)分割。
1.2 顏色特征提取
月季花花色豐富,不同的品種花色不同,總共可分為紅色系、朱紅色系、橙色系等9種,不同品種的月季花在顏色方面的存在差異,并且顏色具有形狀和方向無關(guān)性,所以可以將顏色特征作為月季花識別分類的重要依據(jù)。相比于RGB顏色空間,HSV空間可以更直觀地表達(dá)色彩的色調(diào)、鮮艷程度、亮度,有助于在不同的顏色之間對比。所以,首先將圖像從RGB顏色空間轉(zhuǎn)換到HSV顏色空間,其中,H為色調(diào),取值范圍為0°~360°;S為飽和度,表示顏色接近光譜色的程度,即顏色的深淺程度;V為明度,表示顏色明亮的程度。
1.3 形狀特征提取
不同的月季花品種,花蕾形狀、花朵形態(tài)都有所不同,通過分析這些形狀特征有助于提高月季花分類的準(zhǔn)確率,本文主要從月季花銳度特征、輪廓特征、邊界特征這3個(gè)方面描述月季花的形狀。
1.4 紋理特征提取
不同的月季花的紋理特征也有差異。本文采用融合的灰度共生矩陣和局部二進(jìn)制模式的方法來描述紋理特征。
1.5 特征選擇
本文利用從顏色、形狀、紋理這3個(gè)方面提取到的月季花的22個(gè)特征對月季花進(jìn)行識別研究,但是有些特征對于分類精度影響較小,并且還會影響計(jì)算速度。因此,在進(jìn)行分類前,首先利用隨機(jī)森林算法(RandomForest)進(jìn)行特征選擇。
2 系統(tǒng)總體設(shè)計(jì)
本文采用客戶端/服務(wù)器(C/S)模型,基于移動端的月季花的快速識別方法如圖1所示。移動端工作包括圖像采集和預(yù)處理,具體操作是:在手機(jī)移動端通過攝像頭拍攝獲取月季花圖像并進(jìn)行預(yù)處理,即在觸摸屏上利用手勢操作將花朵輪廓框選,利用GrabCut算法對月季花圖像進(jìn)行分割,將花朵圖像和周圍復(fù)雜的背景分離開,然后將預(yù)處理后的花朵圖像上傳給服務(wù)器。服務(wù)器端工作主要包括:特征分析和提取、分類器分類、返回結(jié)果。服務(wù)器端接收移動端傳輸?shù)膱D像后,利用本文所提出的特征提取算法從顏色、形狀、紋理3個(gè)方面提取月季花視覺特征,并采用分類器進(jìn)行分類。本文實(shí)驗(yàn)數(shù)據(jù)來源于在廣州流花湖公園利用華為P8手機(jī)拍攝的20個(gè)月季花品種。
3 實(shí)驗(yàn)結(jié)果和分析
實(shí)驗(yàn)所用服務(wù)器的配置:酷睿I5處理器,頻率3.1GHz,8GB內(nèi)存。移動端設(shè)備配置:Kirin930處理器,頻率2.2GHz,內(nèi)存3GB,操作系統(tǒng)為Linux系統(tǒng)。
本文利用華為P8手機(jī)拍攝的20個(gè)月季花品種共計(jì)1000幅圖像進(jìn)行實(shí)驗(yàn),每個(gè)品種包括50幅圖片。實(shí)驗(yàn)采取五折交叉驗(yàn)證,訓(xùn)練模型階段將每個(gè)品種等份為5份,依次選取其中的4份作為訓(xùn)練樣本,剩下的一份為測試樣本(袋外數(shù)據(jù)),分別得到5個(gè)數(shù)據(jù)集(每個(gè)訓(xùn)練集包括800幅訓(xùn)練樣本和200幅測試樣本)。
本文提出的從顏色、形狀、紋理3個(gè)方面提取到的22個(gè)視覺特征對月季花的識別具有良好的識別率,利用特征選擇算法提取的18個(gè)強(qiáng)分類特征在保證月季花良好的識別效果的同時(shí),可以減少特征提取階段的工作量以及分類器識別分類階段的計(jì)算量,加快了計(jì)算速度。分類器選擇方面,RandomForest算法在識別率、可靠性、計(jì)算速度等方面表現(xiàn)最佳,所以,本文采用RandomForest算法對提取到的18個(gè)特征進(jìn)行分析。
從實(shí)驗(yàn)結(jié)果可以看出,這20種月季的平均識別率可達(dá)93.5%,識別效果良好。其中,金香玉和金風(fēng)凰的識別率較差,通過分析可知,這兩種花在顏色、形狀特征較為相似,造成了較大的識別誤差。此外,由于數(shù)據(jù)庫中采集的花朵在拍攝角度、花朵輪廓完整性等方面存在差異,并且花朵在不同的時(shí)期形態(tài)也有所不同,在一定程度上干擾了識別效果,降低了識別率。
4 結(jié)語
本文利用圖像處理技術(shù)和手機(jī)移動端相結(jié)合的方法,從顏色、形狀、紋理3個(gè)方面得到了月季花的22個(gè)特征,提出了適合描述月季花視覺特征的方法。利用特征選擇算法對特征變量進(jìn)行重要性排序,通過實(shí)驗(yàn)發(fā)現(xiàn)其中的18個(gè)特征具有良好的分類效果。最終,將有效的特征減少為18個(gè),并作為RandomForest算法的輸入變量。實(shí)際操作中,移動端完成拍照之后,服務(wù)器夠在4s內(nèi)將結(jié)果返回到移動端的用戶界面。實(shí)驗(yàn)表明:本文所提出的方法實(shí)現(xiàn)了對月季花進(jìn)行快速的識別,具有較強(qiáng)的便利性和實(shí)用性。雖然某些品種的月季花分類效果不是特別理想,但是總體上來說,具有較好的分類效果。本文對基于移動端的月季花快速識別做了初步的分析,取得了一定的成果。
參考文獻(xiàn)
[1] 鄭小東,王曉潔,李玲玲.面向植物生長智能監(jiān)控的葉顏色特征提取[J].中國農(nóng)學(xué)通報(bào),2010(19):401-407.
[2] 邵新慶,馮全,邵世祿,等.基于葉片圖像的植物鑒別技術(shù)研究進(jìn)展(綜述)[J].甘肅農(nóng)業(yè)大學(xué)學(xué)報(bào),2010(2):156-160.