楊天天 潘曉星 穆立薔
(東北林業(yè)大學(xué),哈爾濱,150040)
基于植物圖像數(shù)字特征的物種識別是植物物種鑒定工作采用的新方法。雖然,植物的繁殖器官是植物識別的主要依據(jù),但花期、果期存續(xù)時間短,植物樣本不易獲取,而葉片作為植物識別的重要性狀之一,具有留存時間長,樣本易獲取等優(yōu)點(diǎn),雖然葉的形態(tài)變異顯著,但其變異只在一定的范圍之內(nèi)[1]?;谥参锶~片信息識別的研究已有很多,從最早的手工測量葉長、葉寬等[2-3],到運(yùn)用圖像分析軟件來快速、精確地測量葉片的各項參數(shù)。計算機(jī)輔助植物分類與識別系統(tǒng),最早是在2003年由祁亨年提出的,他是基于葉子特征的計算機(jī)輔助植物識別模型和葉緣鋸齒特征來識別植物的[4-5],隨后的研究都運(yùn)用了計算機(jī)輔助技術(shù),發(fā)展至今,已有基于葉片特征或葉片輪廓質(zhì)心的神經(jīng)網(wǎng)絡(luò)分類器等這樣高精度的系統(tǒng)識別分類方法,所獲得的識別率也較高[6-8]。但這些技術(shù)都得依賴計算機(jī)分類等技術(shù),專業(yè)性較強(qiáng),難以普及,且部分的研究中并未對葉片的種屬進(jìn)行識別,而在植物鑒定的研究中,僅對單一葉片識別,意義不大。本研究選取的是楊柳科(Salicaceae)7 種同為柳屬(Salix Linn.)的植物,旨在找出有效的葉片特征的數(shù)字化指標(biāo),運(yùn)用數(shù)學(xué)統(tǒng)計分析方法,通過植物葉片簡單、快速、有效地識別7 種柳屬植物,為今后植物物種識別及鑒定工作提供新方法。
選取了7 種較常見的柳屬植物,為大黃柳(Salix raddeana Laksch.ex Nas.)(1 號)、粉枝柳(Salix rorida Laksch.)(2 號)、谷柳(Salix taraikensis Kimura)(3 號)、旱柳(Salix matsudana Koidz.)(4號)、蒿柳(Salix viminalis Linn.)(5 號)、杞柳(Salix integra Thumb.)(6 號)、崖柳(Salix floderusii Nakai)(7 號)。采集地點(diǎn)在東北林業(yè)大學(xué)涼水實(shí)驗林場,采集時間為2013年7月,葉片采集要求為成熟的完整葉片,采集數(shù)量為每種50 片。
試驗初處理:試驗植物共7 種,每種50 枚葉片,共計350 枚,去葉柄,擦凈葉面,用掃描儀在分辨率300 像素/英寸下從葉片背面進(jìn)行掃描。
試驗數(shù)據(jù)的測量:用圖像處理分析軟件Image-Pro Plus 6.0 完成。
試驗數(shù)據(jù)處理:數(shù)據(jù)的整理及特征指標(biāo)的計算用Microsoft Excel 2003 實(shí)現(xiàn),統(tǒng)計分析、相關(guān)性分析、判別分析用SPSS 19.0 實(shí)現(xiàn)。
葉寬(B):葉片平展,圖像上最寬處左右兩點(diǎn)連線的長度。
最寬處距離(D):即葉寬到葉片基部的距離。
葉長(A):以葉寬為基線,葉片先端點(diǎn)到葉寬的距離與葉片基部點(diǎn)到葉寬的距離之和。
葉周長(C):即葉片圖像中葉片邊緣圍成葉片圖像的弧線全長。
葉面積(S):即葉片圖像中葉片邊緣圍成葉片圖像的面積。
較長距(L1)與較短距(L2):葉片圖像最寬處左右兩點(diǎn)分別與葉先端點(diǎn)的連線的距離,較長的距離稱為較長距,較短的距離稱為較短距。
較長弧(l1)與較短弧(l2):葉片圖像最寬處左右兩點(diǎn)分別沿葉片圖像邊緣到葉先端點(diǎn)的弧線,較長的弧線稱為較長弧,較短的弧線成為較短弧。
葉周長(C):即圖像中,葉片邊緣圍合成的圖形的全長。
葉面積(S):即圖像中,葉片邊緣圍合成的圖形的面積。
葉包膜定義為葉緣相鄰鋸齒最高點(diǎn)的兩兩連線圍成的圖形。葉包膜周長(C1):即葉包膜所圍成的圖形的周長。葉包膜面積(S1):即葉包膜所圍成的圖形的面積。全緣葉是指葉緣平整的葉,故全緣葉的葉包膜與葉片重合,即C=C1,S=S1。
葉寬以上葉片面積(S2):即由葉寬截取的葉片上部的面積。
外接矩形:即以葉長為外接矩形的長,葉寬為外接矩形的寬。
近圓度(P):圖像接近圓形的程度,也能反映葉片邊緣的復(fù)雜程度,即葉周長的平方與葉面積之比。公式:P=C2/S。若值越接近4π,則圖像越接近圓,若值越大,則越遠(yuǎn)離圓形。相同面積的葉片,葉緣越復(fù)雜,近圓度值越大。
長寬比(Ⅰ):葉片圖像的寬窄程度,反映的是葉片的輪廓,即葉長與葉寬的比值。公式:Ⅰ=A/B。
最寬處位置(W):葉片圖像上最寬處在葉片長軸(即葉長)上的位置。公式:W=D/A。
外接矩形面積比(JQ,簡稱外矩面積比):通過葉長、葉寬圍成外接矩形的面積與葉面積的比值。公式:JQ=A×B/S。
外接矩形周長比(JZ,簡稱外矩周長比):通過葉長、葉寬圍成外接矩形的周長與葉周長的比值。公式:JZ=(A+B)×2/C。
較長弧距比、較短弧距比(CH、DH):葉先端點(diǎn)到葉片圖像最寬處左右兩點(diǎn)軌跡的復(fù)雜程度。較長弧距比即為較長弧與較長距之比,較短弧距比即為較短弧與較短距之比。公式:CH=l1/L1、DH =l2/L2。若弧距比值越大,則軌跡越復(fù)雜。
上外距面積比(Q):在葉寬以上部的葉片圖形的外接矩形面積與葉寬以上圖形面積的比值。公式:Q=(A-D)×B/S2。
葉包膜面積比(MQ):葉緣相鄰鋸齒最高點(diǎn)的兩兩連線圍成的圖形的面積與葉片面積的比值。公式:MQ=S1/S。葉包膜面積比值越大邊緣復(fù)雜程度越大。
葉包膜周長比(MZ):葉緣相鄰鋸齒最高點(diǎn)的兩兩連線圍成的圖形的周長與葉片周長的比值。公式:M=C1/C。葉包膜周長比值越小邊緣復(fù)雜程度越大。
為了確定擬選擇的判別指標(biāo),是否可以作為每種植物葉片穩(wěn)定的相對指標(biāo),運(yùn)用SPSS19.0 計算出7 種柳屬植物的不同指標(biāo)的平均值和標(biāo)準(zhǔn)差。由于每種植物葉片的各項指標(biāo)的平均值不同,故不能運(yùn)用標(biāo)準(zhǔn)差來衡量數(shù)據(jù)的變異程度。因此,選取變異系數(shù)(如表1)來驗證數(shù)據(jù)的穩(wěn)定性,變異系數(shù)CV=(標(biāo)準(zhǔn)偏差SD/平均值MN)100%。
表1 7 種柳屬植物判別指標(biāo)的變異系數(shù)
根據(jù)表1的數(shù)據(jù)所示,各組數(shù)據(jù)的變異系數(shù)都較小,故判別指標(biāo)的變異程度低,數(shù)據(jù)相對穩(wěn)定,選取的判別指標(biāo)可以作為穩(wěn)定數(shù)據(jù)進(jìn)行接下來的分析實(shí)驗。因3 號(谷柳)、5 號(蒿柳)、6 號(杞柳)、7號(崖柳)植物均為全緣葉,葉包膜圖形就是葉片圖形,故葉包膜面積比、葉包膜周長比均為1,其變異系數(shù)為0。
因選取的判別指標(biāo)變異程度低,每種柳屬植物的各項指標(biāo)數(shù)值相對穩(wěn)定,所以先運(yùn)用SPSS18.0 對選取的判別指標(biāo)分別進(jìn)行一次典型判別分析(Canonical Discriminant Analysis,CDA,基于典型相關(guān)分析原理估計判別參數(shù),并用得到的判別函數(shù)進(jìn)行判別分析,這種做法叫典型判別分析),得出各單一指標(biāo)對7 種植物典型判別分析的判別正確率。
如表2所示,單一指標(biāo)對7 種植物的判別正確率較低,綜合判別正確率的由大到小的順序依次為:長寬比、近圓度、外矩周長比、葉包膜面積比、最寬處位置、外矩面積比、葉包膜周長比、較短弧距比、較長弧距比、上外距面積比,僅特征指標(biāo)長寬比、近圓度、外接矩形周長比的綜合判別正確率達(dá)到50%,但在針對部分種的識別率較低,如:長寬比對6 號植物的判別正確率僅為38.5%,近圓度對4 號植物的判別正確率為47.1%,外接矩形周長比對1 號、4 號、7 號植物都沒有達(dá)到50%的判別正確率。故僅用單一判別指標(biāo)對植物進(jìn)行判別分析是遠(yuǎn)遠(yuǎn)不夠的。
表2 判別指標(biāo)對7 種柳屬植物的判別正確率
在單一指標(biāo)判別分析中,所有指標(biāo)對7 種柳屬植物均未能達(dá)到較好的識別結(jié)果。如果將單一指標(biāo)兩兩組合,是否可以提高判別正確率,且兩兩相關(guān)性顯著的指標(biāo)組合是否也可以提高判別正確率,有待于探究和分析。故先對所選的判別指標(biāo)兩兩做雙變量相關(guān)分析,然后用相應(yīng)的指標(biāo)組合對7 種植物做典型判別分析,進(jìn)行比較分析。
表3 判別指標(biāo)相關(guān)分析雙側(cè)檢驗P 值
由表3所示,45 組特征指標(biāo)組合中相關(guān)性不顯著的組合只有12 組,分別為:近圓度×上外距面積比、近圓度×葉包膜面積比、近圓度×葉包膜周長比、長寬比×葉包膜面積比、最寬處×外矩周長比、最寬處×較長弧距比、最寬處×較短弧距比、外矩面積比×較長弧距比、外矩面積比×較短弧距比、外矩周長比×上外距面積比、較長弧距比×上外距面積比、較短弧距比×上外距面積比。
而由相應(yīng)的指標(biāo)組合得出的判別分析結(jié)果所示(表3),除葉包膜面積比×葉包膜周長比對單一指標(biāo)葉包膜面積的綜合判別正確率沒有提高(均為45.0%),其他的組合均得到明顯的提高,其中兩兩相關(guān)性極顯著的指標(biāo)組合后也對植物的判別正確率有所改善,如近圓度×長寬比的判別正確率為90.6%,而近圓度對7 種植物的判別正確率為63.3%,長寬比為76.7%。
表3中指標(biāo)組合的判別分析結(jié)果得出,有部分指標(biāo)組合的綜合判別正確率達(dá)到85%以上,可以作為有效的指標(biāo)組合對7 種柳屬植物進(jìn)行判別分析。達(dá)到85%的指標(biāo)組合有:近圓度×長寬比、近圓度×外矩面積比、長寬比×外矩面積比、長寬比×外矩周長比、最寬處×外矩面積比,其中近圓度×長寬比為最優(yōu),綜合判別正確率達(dá)到90.8%。
表4 判別指標(biāo)兩兩組合的判別分析結(jié)果
近圓度和長寬比判別指標(biāo)組合為最優(yōu)識別指標(biāo),對于7 種柳屬植物的典型判別的判別式函數(shù)式有2 個,分別為F1=-0.049x1+1.972x2-7.912,F(xiàn)2=0.479x1- 2.632x2- 4.063。典型判別函數(shù)(F1、F2)分別占總方差的86.4%、13.6%(表5)。
表5 典型判別函數(shù)的判別
近圓度和長寬比指標(biāo)組合對7 種柳屬植物的判別分析結(jié)果(表6)所示,最優(yōu)指標(biāo)組合對1 號、2號、5 號植物可以完全識別,3 號、4 號植物的識別率超過90%,6 號植物為61.5%,容易被錯判至3號、7 號,7 號植物的判別率為77.8%,容易錯判至3 號、6 號。
表6 最優(yōu)指標(biāo)組合對7 種柳屬植物典型判別的正確率
通過對植物葉片圖像的觀察分析,提取植物葉片的多個特征參數(shù),如葉長、葉寬、葉周長及葉面積等,并最終確定了10 項植物葉片的相對特征指標(biāo),運(yùn)用統(tǒng)計分析的方法,對植物葉片做識別檢驗,從而達(dá)到識別植物物種的目的。本實(shí)驗選取的指標(biāo)均為穩(wěn)定的相對指標(biāo),并分別進(jìn)行了單一指標(biāo)和雙重指標(biāo)的典型判別分析。運(yùn)用單一指標(biāo)對7 種柳屬植物進(jìn)行典型判別分析時,每項特征指標(biāo)的綜合判別正確率都較低,最優(yōu)的判別正確率僅達(dá)到76.7%,幾乎是無法識別植物,需要多項指標(biāo)組合才能得到較好的識別結(jié)果。在雙重指標(biāo)的判別分析中,除葉包膜面積比×葉包膜周長比對單一指標(biāo)葉包膜面積的綜合判別正確率沒有提高(均為45.0%),其他所有的雙重指標(biāo)相比于單一指標(biāo)的識別結(jié)果均得到明顯的提高,其中部分指標(biāo)組合的綜合判別正確率達(dá)到85%以上,可以作為有效的指標(biāo)組合對7 種植物進(jìn)行判別分析,近圓度×長寬比的指標(biāo)組合為最優(yōu)識別指標(biāo)組合,綜合判別正確率達(dá)到90.8%,這說明運(yùn)用近圓度×長寬比指標(biāo)組合就可以較好識別出這7 種植物。通過以上實(shí)驗結(jié)果及相關(guān)討論表明,實(shí)驗中選取的7 種植物,用“近圓度”、“長寬比”兩項特征指標(biāo)組合就可以很好的將其葉片識別出來,其中對1 號、2 號、5 號植物可以完全識別,3 號、4 號識別率超過90%,對6 號植物的判別正確率為61.5%,7 號植物為77.8%,對所有植物的判別正確率均超過60%,綜合判別正確率達(dá)到90.8%。
國外對植物數(shù)字化信息的研究也有很多[9-10],主要集中在形態(tài)學(xué)圖像處理方法及計算方法的研究上,對于植物葉片本身的基礎(chǔ)信息涉及較少。在傳統(tǒng)的植物分類中,葉片形狀也作為識別植物的重要特征,本文中“長寬比”指標(biāo)的選取與傳統(tǒng)的植物分類方法保持了一致性,但本研究將葉片的主觀識別特征轉(zhuǎn)化為客觀的數(shù)字參數(shù),更為科學(xué)和可靠。很多人對楊屬、柳屬植物的區(qū)別常誤認(rèn)為是“窄葉為柳,寬葉為楊”,但其不然,實(shí)驗數(shù)據(jù)所示,大黃柳、谷柳的葉片就較寬,葉寬約為葉長的2 倍左右,而粉枝柳、旱柳、蒿柳的葉片就很細(xì)長,特別是蒿柳,葉長達(dá)到葉寬的13 倍之多,說明柳屬下的這7 種植物葉片的長寬比存在著很大的差異。
本實(shí)驗還存在一定局限性,如采集地點(diǎn)較集中,限定了采集要求,對所有地區(qū)的柳屬植物識別可能還不能完全適用,這些都有待于后續(xù)的研究分析。但本實(shí)驗成功的說明了特征信息數(shù)字化的可行性,將人工變?yōu)樽詣?,將人腦變?yōu)殡娔X,將大大提高植物識別的效率。隨著科學(xué)技術(shù)水平的不斷發(fā)展和更新,葉片的特征信息測量必將更加簡便、快捷,客觀數(shù)據(jù)的分析代替形態(tài)術(shù)語的描述,將大大提高植物識別的準(zhǔn)確度。
[1] 張志翔.樹木學(xué):北方本[M].北京:中國林業(yè)出版社,2008.
[2] 胡仁勇,丁炳揚(yáng),黃濤,等.國產(chǎn)菱屬植物數(shù)量分類研究[J].浙江大學(xué)學(xué)報:農(nóng)業(yè)與生命科學(xué)版,2001,27(4):419-423.
[3] 阮仕立.中國野生葡萄種質(zhì)資源描述標(biāo)準(zhǔn)及其計算機(jī)管理的研究[D].楊凌:西北農(nóng)林科技大學(xué),2001.
[4] 祁亨年,壽韜,金水虎.基于葉片特征的計算機(jī)輔助植物識別模型[J].浙江林學(xué)院學(xué)報,2003,20(3):281-284.
[5] 祁亨年.植物外觀特征自動獲取及計算機(jī)輔助植物分類與識別[J].浙江林學(xué)院學(xué)報,2004,21(2):222-227.
[6] Kue Bum Lee,Kwang Woo Chung,Kwang Seok Hong.An implementation of leaf recognition system based on leaf contour and centroid for plant classification[J].Ubiquitous Information Technologies and Applications,2013,214:109-116.
[7] Xia Chunlei,Jang Myung Lee,Li Yan.Plant leaf detection using modified active shape models[J].Biosystems Engineering,2013,116(2):23-35.
[8] Neto J C,Meyer G E,Jones D D,et al.Plant species identification using elliptic fourier leaf shape analysis[J].Computers and Electronics in Agriculture,2006,50(2):121-134.
[9] Menesatti P,Costa C,Paglia G,et al.Shape-based methodology for multivariate discrimination among Italian hazelnut cultivars[J].Biosystems Engineering,2008,101(4):417-424.
[10] Cope J S,Corney D,Clark J Y,et al.Plant species identification using digital morphometrics:a review[J].Expert Systems with Applications,2012,39(8):7562-7573.