黃 敏 朱 曉 朱啟兵 馮朝麗
(江南大學(xué)輕工過(guò)程先進(jìn)控制教育部重點(diǎn)實(shí)驗(yàn)室,無(wú)錫,214122)
玉米是中國(guó)最重要的農(nóng)作物之一,近年來(lái),玉米在食品、飼料等行業(yè)受到越來(lái)越高的關(guān)注度。隨著雜交技術(shù)的進(jìn)一步發(fā)展,玉米的雜交品種得到普遍推廣,與此同時(shí),假種子造成的坑農(nóng)害農(nóng)事件也頻頻發(fā)生。因此,玉米種子的純度識(shí)別是中國(guó)農(nóng)業(yè)生產(chǎn)領(lǐng)域的重要問(wèn)題之一。
現(xiàn)階段,基于機(jī)器視覺(jué)的檢測(cè)技術(shù)在玉米種子的純度識(shí)別上有較為廣泛的應(yīng)用[1-3],但是傳統(tǒng)的機(jī)器視覺(jué)技術(shù)只能獲得種子可見(jiàn)光的形態(tài)學(xué)特征信息,隨著種子品種數(shù)目增多,種子特征的交疊現(xiàn)象就越嚴(yán)重,導(dǎo)致特征的可區(qū)分性變差,從而影響識(shí)別效果。高光譜圖像技術(shù)是近年來(lái)出現(xiàn)的集成光譜技術(shù)和圖像技術(shù)的無(wú)損檢測(cè)新方法,高光譜圖像具有的波段數(shù)量多、數(shù)據(jù)信息量較大,所包含各品種的有效特征信息更多。但是,高光譜圖像中的部分波段受到光源功率、CCD量子效率等綜合因素的影響,圖像的噪聲較大,導(dǎo)致玉米種子的輪廓邊界較模糊,傳統(tǒng)的閾值圖像分割法抗噪性能低,難以準(zhǔn)確提取玉米種子的輪廓。
基于主動(dòng)輪廓模型的圖像分割法具有對(duì)光照和噪聲不敏感的優(yōu)勢(shì),對(duì)于弱邊界、多目標(biāo)等復(fù)雜圖像具有較好的分割效果[4]。近年來(lái),越來(lái)越多地應(yīng)用到醫(yī)學(xué)圖像分割中[5-7],該模型主要利用曲線演化和水平集方法[8],把二維的演化曲線表示成三維的水平集函數(shù),水平集函數(shù)在演化方程的控制下,直到演化曲線到達(dá)目標(biāo)邊界為止。
本文采用基于主動(dòng)輪廓模型的圖像分割法,對(duì)高光譜圖像中的玉米種子進(jìn)行輪廓提取,并對(duì)提取出的形狀特征參數(shù)進(jìn)行歸一化,利用主成分分析法(Principal component analysis,PCA)對(duì)形狀特征參數(shù)降維,同時(shí),為了更好地實(shí)現(xiàn)種子的在線檢測(cè),利用各波段間的相關(guān)性提取出12個(gè)最優(yōu)波段,利用誤差反向傳播(Back propagation,BP)神經(jīng)網(wǎng)絡(luò)模型對(duì)數(shù)據(jù)樣本進(jìn)行分類,并與傳統(tǒng)的閾值分割法作比較,取得了較好的分類效果。
實(shí)驗(yàn)中共使用玉米種子樣本432個(gè),每個(gè)品種的樣本各48個(gè),包括香甜一號(hào)、黃妃、高品樂(lè)、黃糯一號(hào)、超甜2008、綠色超人、黃金糯玉米、早鮮金甜香糯、金糯玉米共9個(gè)不同的品種。所有的樣本分別由不同的種子公司提供。
高光譜圖像的采集系統(tǒng)主要由光譜范圍為400~1 000nm、狹縫寬度為25μm的圖像光譜儀(1003A-10140HyperspcTM VNIR C-Series,Headwall Photonics Inc.,USA),CCD(pixelfly qe IC*285AL,Cooke,USA),150W 的光纖鹵素?zé)簦?50W EKE,3 250K,Techniquip,USA),樣本輸送平臺(tái)和計(jì)算機(jī)等部件組成見(jiàn)圖1。
系統(tǒng)的光譜分辨率為1.29nm,采集光譜圖像的波段間隔為0.64nm,實(shí)驗(yàn)過(guò)程中,所有高光譜圖像的像素都進(jìn)行倍數(shù)為10的合并操作,波段間隔為6.4nm,空間分辨率為0.15mm。經(jīng)過(guò)調(diào)試,得到了最佳的圖像采集參數(shù):曝光時(shí)間350ms,物距為25cm,光源功率為60W。
圖1 高光譜成像系統(tǒng)
為了降低光源的變化對(duì)圖像造成的影響,本實(shí)驗(yàn)每采集15幅高光譜圖像分別作一次白板標(biāo)定圖像和全黑標(biāo)定圖像的采集。
利用實(shí)驗(yàn)過(guò)程中采集的白板標(biāo)定圖像和全黑標(biāo)定圖像,按照式(1)對(duì)圖像進(jìn)行校正。
式中:R為校正后的玉米高光譜圖像;Rsample為樣本圖像;Rreference為白板標(biāo)定圖像;Rdark為全黑標(biāo)定圖像。
對(duì)校正后的高光譜圖像,利用ENVI圖像處理軟件選取每粒玉米種子樣本表面2 000個(gè)像素的區(qū)域,計(jì)算出各類玉米種子的平均相對(duì)反射率,見(jiàn)圖2。
圖2 9類玉米種子的平均相對(duì)反射率
由圖2分析可知,9類玉米種子的平均相對(duì)反射率在492.7~956.5nm波長(zhǎng)范圍內(nèi)區(qū)別較大,而在492.7nm以下和956.5nm以上波段,9類玉米種子的平均相對(duì)反射率較為接近,所得到的玉米種子高光譜圖像反射和吸收強(qiáng)度相當(dāng),在后期的圖像數(shù)據(jù)處理中無(wú)明顯作用。因此,本實(shí)驗(yàn)選取492.7~956.5nm范圍內(nèi)的高光譜圖像數(shù)據(jù)進(jìn)行分析。
利用基于主動(dòng)輪廓模型結(jié)合水平集的方法[9],提取多目標(biāo)條件下的玉米種子輪廓圖像,該模型的能量泛函形式為
每次曲線演化時(shí),該模型通過(guò)對(duì)c1和c2的重新估計(jì),代入方程進(jìn)行不斷的迭代,實(shí)現(xiàn)φ函數(shù)的更新。然后通過(guò)φ函數(shù)的零水平集函數(shù),即可獲得更新后的演化曲線,如此不斷循環(huán),直到演化曲線到達(dá)最終的目標(biāo)邊界,得到最終的分割結(jié)果。圖3為黃金糯玉米在930.7nm波段下輪廓分割的圖像。
本實(shí)驗(yàn)提取出周長(zhǎng)、面積、離心率、長(zhǎng)軸、短軸、當(dāng)量直徑、長(zhǎng)寬比、圓形度、離散度、矩形度、內(nèi)切圓半徑、緊湊度共12個(gè)形狀特征信息[10,11]。
圖3 黃金糯玉米在930.7nm波段下輪廓分割的結(jié)果
其中,利用主動(dòng)輪廓模型分割法提取492.7~956.5nm共73個(gè)波段的圖像輪廓,每粒玉米樣本共有12×73個(gè)形狀特征參數(shù),73表示波段個(gè)數(shù)。利用傳統(tǒng)的閾值分割法在提取492.7~563.6nm和911.4~956.5nm波段時(shí)噪聲較大,無(wú)法準(zhǔn)確分割玉米種子的輪廓。因此,實(shí)驗(yàn)提取563.6~911.4nm共55個(gè)波段的圖像輪廓,每粒玉米共有12×55個(gè)形狀特征參數(shù),55表示波段個(gè)數(shù)。
首先,將兩種圖像分割法所得到的特征參數(shù)均作歸一化處理,對(duì)不同種類的玉米種子樣本,每個(gè)品種選取36個(gè)玉米種子樣本作為分類器的訓(xùn)練樣本集,剩下的12個(gè)玉米種子樣本作為分類器的測(cè)試樣本集。
采用主成分分析法對(duì)形狀特征參數(shù)進(jìn)行數(shù)據(jù)壓縮,主動(dòng)輪廓模型分割法的特征參數(shù)前16個(gè)主成分變量累積貢獻(xiàn)率達(dá)到99.24%,閾值分割法的特征參數(shù)前16個(gè)主成分變量累積貢獻(xiàn)率達(dá)到99.69%,有效地保留了原始變量的特征信息。最后,將經(jīng)過(guò)PCA處理后的訓(xùn)練樣本數(shù)據(jù)和測(cè)試樣本數(shù)據(jù)輸入BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行分類識(shí)別。
建立BP神經(jīng)網(wǎng)絡(luò)模型時(shí),把前16個(gè)主成分作為BP神經(jīng)網(wǎng)絡(luò)的輸入變量,輸出變量為輸入變量所對(duì)應(yīng)的9個(gè)樣本品種,建立16-30-9的三層BP神經(jīng)網(wǎng)絡(luò)模型,隱含層使用正切S型函數(shù),輸出層采用對(duì)數(shù)S型函數(shù),采用trainrp訓(xùn)練函數(shù)來(lái)訓(xùn)練網(wǎng)絡(luò),分類結(jié)果見(jiàn)表1。
表1 BP神經(jīng)網(wǎng)絡(luò)對(duì)9類玉米種子的分類結(jié)果 %
由表1分析,利用主動(dòng)輪廓模型分割法得到的特征參數(shù)所建立的BP神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練和測(cè)試平均正確識(shí)別率均優(yōu)于傳統(tǒng)閾值分割法的特征參數(shù)所建立的模型。表明利用主動(dòng)輪廓模型分割法得到的特征參數(shù)為分類模型提供了更充足有效的特征,分類效果更加顯著。
由于本實(shí)驗(yàn)提取出的波段數(shù)目較多,在線獲取如此多的波段必將影響到玉米檢測(cè)分類的實(shí)時(shí)性。因此,解決這一問(wèn)題的途徑是選擇適合于玉米分類檢測(cè)的最優(yōu)波段并建立其分類模型。本文結(jié)合玉米樣本的類間離散度、類內(nèi)離散度以及波段間的相關(guān)性研究了玉米分類的最優(yōu)波段選擇問(wèn)題。
類內(nèi)離散度表達(dá)的是同一類樣本到類內(nèi)中心的距離,其值越小,說(shuō)明同類樣本相對(duì)越集中;類間離散度是不同類的類間中心距離,選擇的波段應(yīng)能使所有品種的類間離散度盡可能大些,而類內(nèi)離散度盡可能?。?2],即
式中:Wλ,Sλ分別表示第λ個(gè)波段下的類間離散度和類內(nèi)離散度;Eλ越大,表明該波段所能代表的玉米品種特征區(qū)分有效性越大。Wλ,Sλ按照式(7,8)計(jì)算
式中:n=9表示玉米品種個(gè)數(shù);m=36表示每類品種的訓(xùn)練集樣本個(gè)數(shù);xλ,ji∈R12,表示第i類品種在第λ個(gè)波段下第j個(gè)樣本(i=1,…,9,j=1,…,36)的特征向量;∈R12表示第i類品種所有在第λ個(gè)波段下的均值特征向量。
選取最大值Eλ對(duì)應(yīng)的波段為首先最優(yōu)波段λ1,將第λ個(gè)波段下每類品種的均值特征向量R12(i=1,…,9)首尾相接,得到反映類別信息的新的特征向量計(jì)算Tλ與Tλ1的內(nèi)積Hλ=·Tλ1。Hλ反映了波段λ下的特征Tλ與已選波段λ1的特征Tλ1的相關(guān)性,若Hλ大,表示Tλ與Tλ1的相似性較大,不利于分類。因此,應(yīng)選擇Hλ最小的波段為第2個(gè)最優(yōu)波段,記為λ2。再分別計(jì)算剩余的波段與Tλ1,Tλ2的內(nèi)積和,選擇內(nèi)積和最小的波段,記為λ3。以此類推,可獲得選擇后的最優(yōu)波段排列λ1,λ2,λ3,…。
利用上述方法選擇出兩種圖像分割法所提出的所有波段中的各15個(gè)波段,依次對(duì)波段個(gè)數(shù)為1,2,…,15時(shí)的特征參數(shù)經(jīng)過(guò)數(shù)據(jù)歸一化和主成分分析后,主動(dòng)輪廓模型分割法的特征參數(shù)建立16-30-9的三層BP神經(jīng)網(wǎng)絡(luò)進(jìn)行建模,閾值分割法的特征參數(shù)建立16-23-9的三層BP神經(jīng)網(wǎng)絡(luò)進(jìn)行建模,隱含層使用正切S型函數(shù),輸出層采用對(duì)數(shù)S型函數(shù),采用trainrp訓(xùn)練函數(shù)來(lái)訓(xùn)練網(wǎng)絡(luò),訓(xùn)練結(jié)果見(jiàn)圖4。
圖4 不同波段個(gè)數(shù)下的訓(xùn)練結(jié)果
由圖4分析,主動(dòng)輪廓模型的圖像分割法中,通過(guò)BP神經(jīng)網(wǎng)絡(luò)建模的訓(xùn)練精度在12個(gè)波段個(gè)數(shù)時(shí)最高,達(dá)到99.38%,12個(gè)最優(yōu)波段依次為917.9,795.5,756.8,524.9,685.9,518.5,801.9,679.5,847,885.6,602.2和782.6nm。傳統(tǒng)的閾值分割法中,通過(guò)BP神經(jīng)網(wǎng)絡(luò)建模的訓(xùn)練精度在11個(gè)波段個(gè)數(shù)時(shí)最高,達(dá)到99.38%,11個(gè)最優(yōu)波段依 次 為 885.6,628,789,782.6,582.8,570,763.3,711.7,866.3,911.4和892.1nm。
利用最優(yōu)波段個(gè)數(shù)建立的BP神經(jīng)網(wǎng)絡(luò)模型,將每個(gè)品種剩下的12個(gè)玉米種子樣本共108個(gè)樣本輸入模型進(jìn)行驗(yàn)證,得到的分類結(jié)果見(jiàn)表2。
表2 BP神經(jīng)網(wǎng)絡(luò)對(duì)最優(yōu)波段選擇后9類玉米種子的分類結(jié)果 %
由表2分析,主動(dòng)輪廓模型分割法得到的特征參數(shù)在最優(yōu)波段選擇后所建立的BP神經(jīng)網(wǎng)絡(luò)模型的測(cè)試樣本正確識(shí)別率較高,經(jīng)過(guò)最優(yōu)波段的提取后的特征參數(shù)與全波段下的特征參數(shù)具有相同的有效性,測(cè)試分類結(jié)果相同,而且運(yùn)行時(shí)間明顯減少。
本文針對(duì)傳統(tǒng)的閾值圖像分割法難以提取高光譜圖像中部分波段的圖像,利用基于主動(dòng)輪廓模型的圖像分割法對(duì)高光譜圖像中的玉米種子進(jìn)行輪廓分割,提取玉米種子的形狀特征后,采用不同波段特征參數(shù)間的相關(guān)性進(jìn)行波段選擇,采用全波段和最優(yōu)波段的特征參數(shù),利用BP神經(jīng)網(wǎng)絡(luò)模型分別建立分類模型。與傳統(tǒng)的閾值分割法相比,本文方法取得了更好的分類效果,為高光譜圖像在玉米品種純度檢測(cè)上的應(yīng)用提供了一種新的方法。
[1] 閆小梅,劉雙喜,張春慶,等.基于顏色特征的玉米種子純度識(shí)別[J].農(nóng)業(yè)工程學(xué)報(bào),2010,26(S1):46-50.Yan Xiaomei,Liu Shuangxi,Zhang Chunqing,et al.Purity identification of maize seed based on color characteristics[J].Transactions of the CSAE,2010,26(S1):46-50.
[2] 蘇謙,鄔文錦,王紅武,等.基于近紅外光譜和仿生模式識(shí)別玉米品種快速鑒別方法[J].光譜學(xué)與光譜分析,2009,29(9):2413-2416.Su Qian,Wu Wenjin,Wang Hongwu,et al.Fast discrimination of varieties of corn based on near infrared spectra and biomimetic pattern recognition[J].Spectroscopy and Spectral Analysis,2009,29(9):2413-2416.
[3] 程洪,史智興,么煒,等.基于支持向量機(jī)的玉米品種識(shí)別[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2009,40(3):180-183.Cheng Hong,Shi Zhixing,Me Wei,et a1.Corn breed recognition based on support vector machine[J].Transactions of the CSAE,2009,40(3):180-183.
[4] 危自福,畢篤彥,馬時(shí)平.一種改進(jìn)的快速C-V水平集紅外圖像分割[J].數(shù)據(jù)采集與處理,2010,25(3):347-352.Wei Zifu,Bi Duyan,Ma Shiping.Improved fast C-V level set infrared image segmentation[J].Journal of Data Acquisition and Processing,2010,25(3):347-352.
[5] Sun Kaiqiong,Chen Zhen,Jiang Shaofeng.Local morphology fitting active contour for automatic vascular segmentation[J].IEEE Transactions on Biomedical Engineering,2012,59(2):464-473.
[6] Kang D G,Suh D C,Ra J B.Three-dimensional blood vessel quantification via centerline deformation[J].IEEE Transactions on Medical Imaging,2009,28(3):405-411.
[7] Shang Yanfeng,Deklerck R,Nyssen E,et al.Vascular active contour for vessel tree segmentation[J].IEEE Transactions on Biomedical Engineering,2011,58(4):1023-1032.
[8] Osher S,Sethian J A.Fronts propagating with curvature dependent speed:algorithms based on Hamilton-Jacobi formulation[J].Journal of Computational Physics,1988,79(1):12-49.
[9] Chan T F,Vese L A.Active contours without edges[J].IEEE Transactions on Image Processing,2001,10(2):266-277.
[10]王玉亮.基于機(jī)器視覺(jué)的玉米種子品種識(shí)別與檢測(cè)研究[D].泰安:山東農(nóng)業(yè)大學(xué)機(jī)械與電子工程學(xué)院,2008.Wang Yuliang.Maize seed identification and detection based on the machine vision[D].Tai′an:College of Mechanical and Electronic Engineering,Shandong Agriculture University,2008.
[11]金飛劍.基于機(jī)器視覺(jué)的雜草圖像特征提取及識(shí)別研究[D].鎮(zhèn)江:江蘇大學(xué)電氣信息與工程學(xué)院,2007.Jin Feijian.Feature of weeds extraction and identification based on the machine vision[D].Zhenjiang:School of Electronic and Information Engineering,Jiangsu University,2007.
[12]曹玲玲,潘建壽.基于Fisher判別分析的貝葉斯分類器[J].計(jì)算機(jī)工程,2011,37(10):162-164.Cao Lingling,Pan Jianshou.Bayesian classifier based on Fisher discriminant analysis[J].Computer Engineering,2011,37(10):162-164.