周小亮 丁靜軍 吳東洋 竇立君 吳東華
(1.南京林業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院 南京 210037)(2.南京林業(yè)大學(xué)信息中心 南京 210037)(3.南京航空航天大學(xué)繼續(xù)教育學(xué)院 南京 210016)
植物分類學(xué)中,常用的方法是根據(jù)外部器官的形態(tài),即根據(jù)正確描述植物根、莖、葉、花、果等器官形態(tài),通過形態(tài)學(xué)特征正確識別植物。葉片作為植物光合作用的主要器官,具有葉形、葉緣、葉裂、葉尖、顏色等較強的形態(tài)學(xué)特征?;谌~片圖像的特征提取可實現(xiàn)植物自動分類識別[1~3],在植物分類、植物病害自動診斷等方面有著重要的研究意義。近年來,國內(nèi)外學(xué)者提出了大量的基于圖像分析的葉片自動識別方法。
Osikar[4]等提取葉片的幾何特征和矩特征,利用前饋神經(jīng)網(wǎng)絡(luò)對15 種瑞典植物進行分類。該方法在樣本較少的情況下有較高的識別率,但在形狀類似的情況下,識別率明顯下降。Cope[5]等提取葉片Gabor紋理特征對32種植物進行識別,但是由于紋理特征過于單一,識別率并不理想。
針對圖像特征的葉片自動分類識別技術(shù),國內(nèi)學(xué)者也做了大量研究。王曉峰[6]提取葉片的形狀特征和圖像不變矩,采用了移動中心超球分類器實現(xiàn)了20 多種植物的識別,平均識別率達到92%。祁享年[7]等通過提取葉片的大小、形狀和葉緣參數(shù),證明了形狀處理識別植物的可行性。近年來,也有研究者將葉片的紋理特征和形狀特征相結(jié)以提高識別率。張寧[8]等將葉片幾何特征、灰度共生矩陣、紋理特征、分形維數(shù)等多特征結(jié)合,在100 種植物葉片數(shù)據(jù)庫中進行測試,CSA+KNN 法識別率為91.37%。徐浩然[9]等提出不變量多尺度形狀描述方法,該方法具有著較強的縮放、平移和旋轉(zhuǎn)不變性,且對類內(nèi)差異和鉸接形變以及噪聲都有著較好的魯棒性。為了提高匹配的準(zhǔn)確性,在做形狀特征描述時,所提取的特征針對同一物體的不同形狀變化不大,而對不同物體的形狀變化較大[10]。
本文基于形狀上下文(SC)描述子,提出改進的形狀描述子算法(N-SC),通過提取葉片圖像的輪廓信息對不同形狀葉片能夠準(zhǔn)確識別,相比傳統(tǒng)的SC描述子具有較高的匹配速度及旋轉(zhuǎn)不變性。
形狀上下文(SC)算法是 Belongie[11]等于 2002年提出,該算法通過選取有限的點集來描述樣本的邊界,是一種基于圖像形狀輪廓的描述方法。不同邊界樣本點間的相對位置能夠較好的描述該形狀,且樣本點距離參考點之間的距離決定了該樣本點在描述形狀中的有效程度。為更好地表達位置信息,可采用極坐標(biāo)系統(tǒng)計樣本點相對于參考點的位置關(guān)系。
在形狀描述方法中,將輪廓看作是一組點,并假設(shè)輪廓可由一組有限的離散點表示。若給出n個點的集合P={p1,…,pn},則當(dāng)n→∞時,則可獲得連續(xù)圖像輪廓,故n 越大,輪廓描述越精確,故使用的描述子通過有限的采樣點來建立描述子,如圖1所示。
圖1 葉片輪廓采樣
在輪廓矩陣中,若需描述點集P 中的任意一點pi,可通過計算剩余的n-1 個點與該點的位置關(guān)系確定。以pi為圓心,r 為半徑,將此區(qū)域在逆時針方向12 分以形成模板,即以點pi為極點建立極坐標(biāo)系,這樣使得點pi到其他各點的向量簡化為極坐標(biāo)系中每個扇區(qū)里的點數(shù)分布,如圖2所示。
圖2 圖像輪廓極坐標(biāo)
由于點陣圖像數(shù)據(jù)基于笛卡爾坐標(biāo)系,而形狀上下文特征提取基于極坐標(biāo)系,則需坐標(biāo)系轉(zhuǎn)換。
設(shè)極坐標(biāo)系極軸方向與笛卡爾坐標(biāo)系水平方向一致,若x0表示所選點為極坐標(biāo)系原點的橫坐標(biāo),y0表示所選點為極坐標(biāo)系原點的縱坐標(biāo),x表示邊緣點的橫坐標(biāo),y表示邊緣點的縱坐標(biāo),則笛卡爾坐標(biāo)轉(zhuǎn)換極坐標(biāo)如式(1)與式(2)所示。
其中,r為所選點與極坐標(biāo)原點距離,θ為所選點與極坐標(biāo)原點連線與極軸間夾角。
將數(shù)據(jù)區(qū)域用極坐標(biāo)分割后統(tǒng)計統(tǒng)計其余各點到極坐標(biāo)原點的角度θ和距離r,建立pi的形狀直方圖作為pi的描述子,如圖3所示。
圖3 形狀直方圖
直方圖密集程度代表該區(qū)域點的密度,顏色越深,則該區(qū)域點的數(shù)量越密集。由圖(b)和圖(c)可知,黑點和紅點在數(shù)據(jù)分布上具有相似性,而藍點則有較大差異。
形狀上下文(SC)描述子采用直方圖描述數(shù)據(jù)分布,提取輪廓點的個數(shù)對計算性能影響較大,即輪廓點個數(shù)較多,識別準(zhǔn)確度較高,輪廓點較少則結(jié)果不精確。若采用χ2 分布來計算匹配代價,即認(rèn)為當(dāng)輪廓點數(shù)量達到一定程度,則數(shù)據(jù)分布趨向于正態(tài)分布,在獲得較高的計算精度的同時,計算時間不會明顯增加。
若pi表示第一個輪廓P 中的樣本點,qj表示第二個輪廓 Q 中的樣本點,g(k)表示 pi 的形狀直方圖,h(k)表示 qj的形狀直方圖,則代價值Cij為恒正的值:
由式(3)可知,代價值Cij越小,兩個樣本點的形狀描述子越相似,反之,若代價值Cij越大,則兩個樣本點相似度越差。
若構(gòu)建代價矩陣 Mn×n,其中 M 為 Cij的集合,則該代價矩陣M 可描述兩個樣本點集中每一對樣本點間的相似程度。
若H(π)為兩個輪廓樣本整體的匹配代價,π為一個置換,若 qπ(i)為每個 pi的最優(yōu)解,可根據(jù)代價矩陣M,計算輪廓樣本整體的匹配代價。
若希望獲得最小的總代價,即求min(H(π))。其中,min(H(π))表示兩個輪廓樣本總代價最小。
選取Betula pubescens 數(shù)據(jù)集中的一組葉片圖像,如圖4 所示,分別采用SC 描述子和SC-X 描述子計算iPAD2_C09_EX01.JPG 與其余三幅圖間的匹配代價。
圖4 測試葉片
表1 匹配代價
由表1 可知,N-SC 描述子匹配代價遠小于傳統(tǒng)SC 描述子。其中,圖(a)與圖(b)匹配代價最小,cost 值為1.3655,說明這兩幅圖像相似度最高。圖(a)與圖(d)匹配代價最大,因為圖(d)葉片內(nèi)部具有破損及病害斑塊,破損及斑塊導(dǎo)致的輪廓數(shù)據(jù)提取影響了識別效果。
基于形狀上下文的圖像識別與匹配算法流程如圖5所示。
圖5 圖像識別與匹配算法
由圖5可知,葉片識別與匹配算法流程如下。
第一步:利用K-Means算法分割圖像;
第二步:利用Otsu算法將圖像二值化;
第三步:采樣圖像邊界,每隔四個邊界點選取一個輪廓點,得到輪廓點集P;
第四步:坐標(biāo)轉(zhuǎn)換,將笛卡爾坐標(biāo)轉(zhuǎn)化為極坐標(biāo);
第五步:利用χ2 分布計算匹配代價Cij,得到代價矩陣M;
第六步:利用匈牙利算法評估代價矩陣M,獲得最小代價值cost。
實驗采用UCI 數(shù)據(jù)庫中的leaf 數(shù)據(jù)集。UCI數(shù)據(jù)庫是由加州大學(xué)歐文分校為圖像識別和機器學(xué)習(xí)而建立的數(shù)據(jù)庫,該數(shù)據(jù)庫目前共有335 個數(shù)據(jù)集。UCI-leaf數(shù)據(jù)集包含40類植物葉片圖像,包含木本及草本葉片數(shù)據(jù),每類葉片包含數(shù)量為8~16張不等的圖像,部分葉片圖像如圖6所示。隨機選取其中的5類葉片,每類葉片選取10張圖像作為實驗數(shù)據(jù)集。實驗平臺采用Intel Core i5 處理器,8G 內(nèi)存,MacOS10.14.2,算法實現(xiàn)采用Matlab 2017b。
圖6 leaf數(shù)據(jù)集部分葉片圖像
選取leaf 數(shù)據(jù)集中Betula pubescens(柔毛樺)、Acer palmaturu(七角楓)、Castanea sativa(歐洲板栗)、Populus alba(銀白楊)四種不同的葉片圖像。這四張葉片圖像在顏色及形狀上各有特點。圖6中2 及5 分別為七角及五角形狀,4 中葉片邊界平滑,1 中葉片為橢圓心形,且邊緣有輕微破損,5 中葉片左側(cè)中間帶有蟲洞,2 中葉片背景為灰色。通過N-SC 描述子計算柔毛樺1 與其他三種葉片之間的匹配代價。
圖7 葉片圖像
表2 圖像間匹配代價
根據(jù)表2可知,不同形狀的葉片,匹配代價cost差異明顯。其中圖7(a)與圖7(c)匹配代價為18.5669,說明這兩種葉片相似性最差,圖7(a)為闊卵形,而圖7(c)葉片為長橢圓形。在三組數(shù)據(jù)中,圖7(a)與圖7(d)匹配代價值最小為7.9248,表示兩種葉片在形狀上最為相似,圖7(a)和圖(7d)都屬于闊卵形,但兩者為不同樹種,并且圖7(d)有蟲洞干擾。
為驗證N-SC 算法的識別準(zhǔn)確性,選取一幅銀白楊葉片圖像如圖8 所示,與數(shù)據(jù)集中的5 類各10張葉片圖像對比,計算匹配代價Cost。
圖8 銀白楊
選取leaf 數(shù)據(jù)集中Quercus suber(歐洲栓皮櫟)、Populus nigra(黑楊)、Quercus robur(夏櫟)、Betula pubescens(柔毛樺)、Populus alba(銀白楊)的5 類各10 張圖像作為實驗數(shù)據(jù),結(jié)果如表3 所示,其中第5類Populus alba為銀白楊。
由表3 可知,銀白楊葉片與第5 類即銀白楊葉片匹配代價最小,平均Cost 值為5.36327。而該葉片與Quercus robur(夏櫟)差異最大,其中銀白楊葉片呈卵圓形,掌狀5淺裂,而Quercus robur(夏櫟)葉片為長倒卵形。銀白楊葉片與第二類Populus nigra(黑楊)葉片平均Cost 值為8.00923,說明兩者相似度較高,因為Populus nigra(黑楊)葉片與銀白楊葉片同都為卵圓形,但黑楊為菱狀卵圓形。
表3 匹配代價
統(tǒng)計上述50 幅葉片圖像匹配時間,如圖9 所示,總匹配花費257.053s,平均單幅圖像識別時間5.141s。在總識別時間中,圖像分割與輪廓提取算法耗時51.88s,形狀上下文描述子建立耗時3.080s,代價矩陣計算耗時0.529s,匈牙利算法耗時200.682s。由此可見,輪廓集匹配階段耗時最高。
圖9 葉片識別時間折線圖
由圖9 可知,大部分葉片圖像匹配時間介于4s~6s 之間,平均的識別時間為 4.8141s。其中,部分葉片圖像匹配時間低于4s,只有一幅葉片識別時間高于6s,為6.883s。葉片圖像匹配效率與輪廓的復(fù)雜程度及采樣點數(shù)目有關(guān),輪廓越復(fù)雜,采樣點越多,匹配耗時越長。其中第10 幅圖像為歐洲栓皮櫟葉片,其形狀為長橢圓形,輪廓與銀白楊葉片差異較大。而第45 幅為銀白楊葉片,其輪廓與待比較葉片相似程度最高。
植物葉片形狀,即葉片輪廓,基于葉片圖像的植物分類方法研究是植物分類學(xué)的一個重要研究方向[12]。不同的植物,葉形的變化很大,根據(jù)特征數(shù)據(jù)結(jié)合植物分類學(xué)知識能夠識別葉片的基本形狀[13],以達到快速有效的植物種類識別,對于區(qū)分植物、探索植物間親緣關(guān)系具有重要意義。本文提出一種改進的SC 形狀上下文描述子(N-SC),在對葉片圖像膨脹[14]、腐蝕[15]等預(yù)處理的基礎(chǔ)上,利用Ostu[16]算子對圖像進行二值化處理,進而提取圖像的形狀特征,使用匈牙利算法計算圖像間匹配代價。實驗結(jié)果表明該算法具有較高的識別準(zhǔn)確度。
但該方法也存在一些缺陷,為了保證圖像邊界的連續(xù)性,N-SC描述子選取更多的輪廓點,導(dǎo)致識別時間較長,平均4.8s。該算法可有效區(qū)分葉片形狀差異較大植物,對于形狀相似性較高的葉片圖像具有明顯的局限性。
在進一步的工作中,可提取關(guān)鍵代表點描述圖像輪廓,以減少輪廓點數(shù)量,進一步優(yōu)化匹配代價Min(cost)計算方法。結(jié)合葉片紋理信息,可以解決不同植物相同葉片的問題。