楊 利,葉明全
皖南醫(yī)學(xué)院計(jì)算機(jī)教研室,安徽蕪湖,241002
基于S-WLLE算法和SVR的植物葉片圖像識(shí)別方法
楊 利,葉明全
皖南醫(yī)學(xué)院計(jì)算機(jī)教研室,安徽蕪湖,241002
針對(duì)加權(quán)局部線性嵌入(Weighted Locally Linear Embedding, WLLE)算法不能充分挖掘樣本類別信息以及傳統(tǒng)流形學(xué)習(xí)算法中利用已有訓(xùn)練樣本流形鄰域關(guān)系近似得到測(cè)試樣本低維嵌入的低精確性,提出了基于監(jiān)督加權(quán)局部線性嵌入(Supervised Weighted Locally Linear Embedding, S-WLLE)算法和支持向量機(jī)回歸(Support Vector Regression, SVR)的植物葉片圖像識(shí)別方法。首先利用葉片樣本監(jiān)督距離代替WLLE算法中的歐式距離,對(duì)訓(xùn)練樣本進(jìn)行降維;然后學(xué)習(xí)訓(xùn)練樣本已有數(shù)據(jù)得到SVR模型,預(yù)測(cè)測(cè)試樣本的低維嵌入;最后利用最近鄰分類器分別實(shí)現(xiàn)正負(fù)類樣本以及負(fù)負(fù)類樣本之間的識(shí)別。實(shí)驗(yàn)表明,該算法不僅提高了正負(fù)類葉片的識(shí)別精度,而且能夠有效實(shí)現(xiàn)負(fù)負(fù)類葉片的識(shí)別。
葉片識(shí)別;監(jiān)督距離;加權(quán)局部線性嵌入;降維;支持向量機(jī)回歸
當(dāng)前,植物葉片識(shí)別在農(nóng)業(yè)信息化和生態(tài)環(huán)境保護(hù)中起著非常重要的作用,因此受到國(guó)內(nèi)外學(xué)者的普遍關(guān)注,部分學(xué)者還做了一系列相關(guān)的研究,取得了很多有益的研究成果。目前,識(shí)別植物葉片的方法主要分為兩種:一種提取顏色、形狀和紋理作為葉片分類特征,然后利用分類器識(shí)別葉片的類別[1-8];另一種運(yùn)用流形學(xué)習(xí)算法對(duì)葉片高維特征進(jìn)行維數(shù)約簡(jiǎn),在低維空間利用分類器實(shí)現(xiàn)葉片的識(shí)別[9-11]。由于第一種方法所用的葉片分類特征容易受到外界環(huán)境的干擾,從而影響葉片的識(shí)別率。因此,第二種方法成為當(dāng)前識(shí)別葉片的主要方法。
流形學(xué)習(xí)能夠有效地進(jìn)行特征提取和非線性維數(shù)約簡(jiǎn),能從高維觀測(cè)數(shù)據(jù)中找到潛在的低維流形結(jié)構(gòu),并構(gòu)造從高維空間到低維空間的非線性映射。局部線性嵌入(LocallyLinearEmbedding,LLE)[12]和等距特征映射(IsometricFeatureMapping,Isomap)[13]是流形學(xué)習(xí)兩種具有代表性的算法,許多研究者在該算法的基礎(chǔ)上進(jìn)行了改進(jìn)。文獻(xiàn)[9]提出了一種加權(quán)局部線性嵌入(WLLE)算法,在LLE算法的代價(jià)函數(shù)中加入了樣本的重要性值,有效地抑制了噪聲點(diǎn)和樣本外點(diǎn),但是該算法沒有運(yùn)用樣本的類別信息,限制了葉片圖像的識(shí)別率。文獻(xiàn)[10]提出一種新的測(cè)地距離定義,然后引入到Isomap算法中,雖然該算法能夠抑制樣本噪聲,同時(shí)利用了樣本的類別信息,但是算法復(fù)雜度較大,不容易實(shí)現(xiàn)。文獻(xiàn)[11]在WLLE算法中加入了樣本的類別信息,在一定程度上提高了葉片識(shí)別率,但是測(cè)試樣本的低維嵌入是通過已有訓(xùn)練樣本流形鄰域關(guān)系近似得到,影響了葉片識(shí)別率的提高。同時(shí),這些文獻(xiàn)中僅僅實(shí)現(xiàn)了正負(fù)類葉片圖像的識(shí)別,并沒有區(qū)分負(fù)負(fù)類葉片圖像之間的類別。
為此,本文提出一種基于監(jiān)督加權(quán)局部線性嵌入(S-WLLE)算法和支持向量機(jī)回歸(SVR)的植物葉片圖像識(shí)別方法。該方法利用樣本監(jiān)督距離代替WLLE算法中的樣本歐式距離,構(gòu)成監(jiān)督WLLE算法,然后利用該算法對(duì)葉片訓(xùn)練樣本高維特征進(jìn)行維數(shù)約簡(jiǎn),得到高維訓(xùn)練樣本的低維嵌入,再運(yùn)用SVR對(duì)訓(xùn)練樣本的高維特征和低維嵌入進(jìn)行學(xué)習(xí),得到支持向量機(jī)回歸模型,預(yù)測(cè)測(cè)試樣本的低維嵌入,最后在低維空間利用最近鄰分類器分別實(shí)現(xiàn)正負(fù)類樣本之間以及負(fù)負(fù)類樣本之間的識(shí)別。
2.1 支持向量機(jī)回歸
支持向量機(jī)(Support Vector Machine,SVM)是一種常用的機(jī)器學(xué)習(xí)方法。該方法通過非線性變換,將輸入樣本集映射到高維特征空間,從而改善其分離狀況。支持向量機(jī)回歸[14]分為線性回歸和非線性回歸,本文主要利用支持向量機(jī)非線性回歸預(yù)測(cè)高維空間樣本的低維輸入。
對(duì)于在原始Rn空間不可線性分離的數(shù)據(jù)集S={(x1,y1),…,(xl,yl)|xi∈Rn,yi∈R},首先通過非線性映射φ將數(shù)據(jù)集S映射到高維特征空間,使得S在特征空間H中擁有較好的線性回歸特征,然后在該特征空間進(jìn)行線性回歸,再回歸到原始Rn空間。支持向量機(jī)非線性回歸優(yōu)化問題的對(duì)偶形式為:
(1)
2.2 支持向量機(jī)回歸算法
支持向量機(jī)回歸算法[15]的具體步驟如下:
(1)給定數(shù)據(jù)集S={(x1,y1),…,(xl,yl)},xi為高維空間數(shù)據(jù),yi是xi對(duì)應(yīng)的低維輸出,且i=1,2,…,l;
(2)
(3)
(4)
(4)對(duì)于測(cè)試樣本x,選擇某類型的核函數(shù)K(xi,x),構(gòu)造支持向量機(jī)的非線性函數(shù):
(5)
由此函數(shù)計(jì)算高維測(cè)試樣本的低維輸出。
3.1 加權(quán)局部線性嵌入算法(WLLE)
由于經(jīng)典流形學(xué)習(xí)算法之局部線性嵌入算法(LLE)很容易受到噪聲的干擾,為了提高算法的魯棒性,文獻(xiàn)[9]提出一種加權(quán)局部線性嵌入算法(WLLE)。WLLE算法構(gòu)建了樣本的重要性值,然后將該重要性值加入到LLE算法的代價(jià)函數(shù)中。因?yàn)樵肼朁c(diǎn)和樣本外點(diǎn)的重要性值相對(duì)較小,對(duì)算法產(chǎn)生的影響較小,因而WLLE算法能夠有效地抑制噪聲點(diǎn)和樣本外點(diǎn)。
WLLE算法雖然能夠抑制噪聲點(diǎn)和樣本外點(diǎn),但是該算法利用樣本的歐式距離尋找樣本近鄰點(diǎn)和計(jì)算樣本的重要性值,沒有利用樣本的類別信息。而樣本的監(jiān)督距離能夠很好地挖掘樣本的類別信息,有助于提高葉片圖像的識(shí)別率,因此,針對(duì)WLLE算法存在的缺陷,提出一種WLLE算法和樣本監(jiān)督距離結(jié)合的監(jiān)督WLLE算法(S-WLLE)。
3.2 監(jiān)督WLLE算法(S-WLLE)3.2.1 數(shù)據(jù)點(diǎn)的監(jiān)督距離
已有數(shù)據(jù)點(diǎn)(xi,ci),xi∈RD且ci是xi的類別,i=1,2,…,N,則樣本點(diǎn)xi和xj的監(jiān)督距離D(xi,xj)[16]定義為:
(6)
其中,d(xi,xj)為樣本點(diǎn)xi和xj的歐氏距離。D(xi,xj)是關(guān)于d2(xi,xj)/β的函數(shù),當(dāng)參數(shù)α取為0.25時(shí),坐標(biāo)圖如圖1所示。圖1中,虛線代表不同類樣本之間的監(jiān)督距離,實(shí)線則代表同類樣本之間的監(jiān)督距離,由圖1可知,樣本類內(nèi)監(jiān)督距離小于類間監(jiān)督距離,而該特性能夠幫助提高樣本的識(shí)別率。
圖1 d(xi,xj)關(guān)于d2(xi,xj)/β的坐標(biāo)圖
公式(6)中存在兩個(gè)參數(shù)β和α,β的取值依賴于數(shù)據(jù)集的密度,通常情況下,將所有數(shù)據(jù)點(diǎn)之間歐式距離的平均值設(shè)置為參數(shù)β的值;而參數(shù)α是可調(diào)參數(shù),取值范圍為[0,0.65]。當(dāng)α取0.65時(shí),圖1中兩條曲線則會(huì)相交,此時(shí)d2(xi,xj)/β的值為0.38。
3.2.2S-WLLE算法
設(shè)采樣得到的訓(xùn)練數(shù)據(jù)集X={x1,x2,…,xn}?RD,S-WLLE算法具體步驟為:
(1)計(jì)算訓(xùn)練數(shù)據(jù)集X中樣本點(diǎn)之間的歐式距離,參數(shù)β的取值為總樣本的歐式距離平均值;
(2)根據(jù)公式(6)計(jì)算數(shù)據(jù)集X中任意樣本點(diǎn)的監(jiān)督距離xi,在此基礎(chǔ)上尋找樣本的K近鄰,K是預(yù)先設(shè)定的值;
(3)在已知K鄰域的基礎(chǔ)上,計(jì)算樣本點(diǎn)xi的加權(quán)局部重構(gòu)權(quán)值矩陣W,使得重構(gòu)誤差函數(shù)ε(W)最小,其中
(7)
權(quán)值矩陣W由Wij構(gòu)成,Wij是樣本點(diǎn)xi與其第j個(gè)近鄰點(diǎn)xi的權(quán)值,當(dāng)xi與xj不是近鄰點(diǎn)時(shí),Wij為0。Wij滿足約束條件
(8)
(4)計(jì)算樣本點(diǎn)xi的重要性值Dij,其中
(9)
(10)
公式(10)中,λ是可調(diào)參數(shù)。
(5)保持Wij不變,計(jì)算樣本點(diǎn)xi在低維空間的映射yi,使得加權(quán)誤差函數(shù)εi(W)最小,其中
(11)
低維映射yi∈RD(d遠(yuǎn)小于D)且滿足條件:
(12)
式(11)中,
M=D(I-W)T(I-W)
D=[D11,D22,…,Dnn]
(13)
(6)對(duì)稀疏矩陣M進(jìn)行非稀疏對(duì)角化,得到較小的(d+1)個(gè)特征值對(duì)應(yīng)的特征向量,由于第一個(gè)特征值幾乎為零,故舍去。則訓(xùn)練樣本集X對(duì)應(yīng)的低維映射Y為矩陣M第2~(d+1)個(gè)非零特征值對(duì)應(yīng)的特征向量。
具體算法步驟如下:
(1)計(jì)算樣本的監(jiān)督距離,將其代替WLLE算法中的歐式距離形成監(jiān)督WLLE算法(S-WLLE);
(2)利用S-WLLE算法對(duì)葉片訓(xùn)練樣本高維特征進(jìn)行降維,得到低維嵌入;
(3)利用SVR對(duì)葉片訓(xùn)練樣本高維特征和低維嵌入進(jìn)行學(xué)習(xí),得到SVR訓(xùn)練模型;
(4)利用訓(xùn)練好的SVR模型預(yù)測(cè)測(cè)試樣本的低維嵌入;
(5)在低維空間利用最近鄰分類器分別實(shí)現(xiàn)正負(fù)類葉片圖像之間以及負(fù)負(fù)類葉片圖像之間的識(shí)別。
在中國(guó)科學(xué)院合肥智能所建立的植物葉片圖像數(shù)據(jù)庫(kù)(http://www.intelengine.cn/data)中選取實(shí)驗(yàn)圖片。該葉片數(shù)據(jù)庫(kù)包含220種植物,共16 846幅葉片圖像。實(shí)驗(yàn)從烏蘞莓圖像中選取64幅圖像,其中34幅作為正類訓(xùn)練樣本,再?gòu)亩庞?、夾竹桃、東京櫻花、龍牙花和含笑5種葉片圖像中各選取20幅圖像,選取每個(gè)物種的10幅共50幅圖像作為負(fù)類訓(xùn)練樣本,將剩余80幅圖像作為測(cè)試樣本。驗(yàn)證本文所提方法的有效性,主要做了兩個(gè)實(shí)驗(yàn):實(shí)驗(yàn)一利用主成分分析(PCA)、LLE、WLLE和S-WLLE算法對(duì)葉片圖像高維特征進(jìn)行降維,驗(yàn)證S-WLLE算法有效的聚類能力;實(shí)驗(yàn)二利用S-WLLE算法對(duì)葉片圖像的訓(xùn)練樣本進(jìn)行降維,然后分別利用已有訓(xùn)練樣本流形鄰域關(guān)系近似計(jì)算測(cè)試樣本低維嵌入和SVR預(yù)測(cè)測(cè)試樣本的低維嵌入,在低維空間分別實(shí)現(xiàn)圖2(a)與圖2(b)~(f)以及圖2(b)~(f)之間的識(shí)別。圖2為正負(fù)類葉片圖像。
圖2 正負(fù)類葉片圖像
從原始葉片數(shù)據(jù)庫(kù)中選取的葉片圖像大小不統(tǒng)一,對(duì)圖像進(jìn)行剪裁,將它們調(diào)整為128*128像素大小,然后利用小波變換將實(shí)驗(yàn)圖像低采樣成64*64像素大小,256灰度級(jí),白色背景的灰度圖像。每幅灰度圖像構(gòu)成了一個(gè)矩陣,再將該矩陣?yán)梢痪S的列向量[17],即訓(xùn)練樣本和測(cè)試樣本都可以用一個(gè)4096維向量表示。
5.1 聚類性能分析
實(shí)驗(yàn)中,每幅葉片圖像可由4096維特征向量表示,由于這4096維特征向量中存在著冗余數(shù)據(jù),可能會(huì)影響葉片識(shí)別率,因此,需要對(duì)葉片特征向量進(jìn)行降維。使用主成分分析(Principal Component Analysis,PCA)[18]、LLE[12]、WLLE[9]和S-WLLE算法分別對(duì)葉片高維特征向量進(jìn)行維數(shù)約簡(jiǎn)。圖3為不同算法對(duì)葉片圖像的聚類效果圖,圖中每一個(gè)點(diǎn)代表一幅葉片圖像。
圖3 不同算法聚類效果圖
由圖3可知,由于PCA和LLE算法容易受噪聲干擾且不能利用樣本的類別信息,故聚類的效果較差。WLLE算法在LLE算法的代價(jià)函數(shù)中加入了樣本的重要性值,在一定程度上能夠抑制樣本中的噪聲點(diǎn)和樣本外點(diǎn),因此聚類效果相對(duì)PCA和LLE算法稍有改善。而S-WLLE算法在抑制噪聲點(diǎn)和樣本外點(diǎn)干擾的同時(shí),充分挖掘了樣本的類別信息。由圖3(d)可知,同類樣本緊密聚在一起,不同類樣本距離較遠(yuǎn),所以聚類效果是最好的。因此,本文利用S-WLLE算法對(duì)葉片圖像高維特征進(jìn)行降維,再在低維空間利用分類器識(shí)別葉片圖像。
表1 不同K、α情況下葉片圖像識(shí)別率 單位:%
5.2 參數(shù)選擇
在葉片分類實(shí)驗(yàn)中,利用S-WLLE算法對(duì)葉片高維特征進(jìn)行降維,而S-WLLE算法需要確定參數(shù)λ、近鄰數(shù)K和參數(shù)α的取值。實(shí)驗(yàn)時(shí),根據(jù)經(jīng)驗(yàn)選取調(diào)節(jié)參數(shù)λ為100[9]。近鄰數(shù)K和參數(shù)α的取值會(huì)直接影響降維算法的性能。鄰域K若太小,會(huì)破壞流形的全局特性;若K太大,數(shù)據(jù)降維后就會(huì)失去原有的非線性特性。而樣本的監(jiān)督距離隨著參數(shù)α的改變而改變。為了確定K和α值,實(shí)驗(yàn)固定數(shù)據(jù)集不變,K在區(qū)間[3,10]內(nèi)依次取值,在區(qū)間[0,0.35]內(nèi)取值,步長(zhǎng)為0.05。實(shí)驗(yàn)中,利用已有訓(xùn)練樣本流形鄰域關(guān)系近似得到測(cè)試樣本低維嵌入,然后在低維空間利用最近鄰分類器識(shí)別葉片圖像。表1為不同K、α情況下葉片圖像識(shí)別率。
由表1中不同近鄰數(shù)K和參數(shù)α對(duì)應(yīng)得到的葉片識(shí)別率可知,利用S-WLLE算法對(duì)葉片高維特征進(jìn)行降維,在低維空間利用最近鄰分類器識(shí)別葉片圖像,綜合考慮K和α,當(dāng)K取6,α取0.2時(shí),得到的葉片識(shí)別率最高。因此,實(shí)驗(yàn)一就采用此最優(yōu)參數(shù)組合。
5.3 實(shí)驗(yàn)結(jié)果
為了驗(yàn)證本文方法能夠有效提高葉片圖像的識(shí)別率,本文做了兩個(gè)實(shí)驗(yàn)。實(shí)驗(yàn)一利用算法PCA、LLE、WLLE和S-WLLE分別對(duì)葉片圖像高維特征進(jìn)行降維。對(duì)于S-WLLE算法,利用已有訓(xùn)練樣本流形鄰域關(guān)系近似得到測(cè)試樣本低維嵌入,然后在低維空間利用最近鄰分類器識(shí)別正負(fù)類葉片圖像。每個(gè)實(shí)驗(yàn)重復(fù)20次,實(shí)驗(yàn)中訓(xùn)練樣本和測(cè)試樣本在樣本集中隨機(jī)抽取。表2為20次實(shí)驗(yàn)不同算法的葉片最佳識(shí)別率和平均識(shí)別率。
由表2葉片圖像識(shí)別結(jié)果可知,由于監(jiān)督算法S-WLLE充分挖掘了樣本的類別信息,因此利用該算法得到的葉片圖像識(shí)別率要明顯高于其他三種算法。
表2 不同算法的葉片圖像識(shí)別結(jié)果 單位:%
實(shí)驗(yàn)二利用S-WLLE算法對(duì)葉片訓(xùn)練樣本高維特征進(jìn)行降維,然后分別利用已有訓(xùn)練樣本流形鄰域關(guān)系近似計(jì)算測(cè)試樣本低維嵌入和利用SVR預(yù)測(cè)測(cè)試樣本的低維嵌入這兩種方法計(jì)算測(cè)試樣本的低維嵌入。實(shí)驗(yàn)中SVR選擇徑向基(RBF)函數(shù)作為核函數(shù),其他參數(shù)選擇系統(tǒng)默認(rèn)值。在低維空間利用最近鄰分類器分別對(duì)葉片正負(fù)類樣本以及負(fù)負(fù)類樣本進(jìn)行識(shí)別。每組實(shí)驗(yàn)重復(fù)20次,每次實(shí)驗(yàn)隨機(jī)產(chǎn)生訓(xùn)練樣本和測(cè)試樣本,實(shí)驗(yàn)中K取3,α取0.20,以20次實(shí)驗(yàn)的最佳識(shí)別率和平均識(shí)別率作為葉片圖像識(shí)別結(jié)果。表3為20次實(shí)驗(yàn)葉片圖像的最佳識(shí)別率和平均識(shí)別率。
由表3可知,利用SVR預(yù)測(cè)測(cè)試樣本的低維嵌入得到的葉片圖像識(shí)別率要明顯高于傳統(tǒng)方法。同時(shí)利用本文方法能夠有效地區(qū)分葉片負(fù)類樣本。
表3 葉片圖像的識(shí)別結(jié)果 單位:%
在葉片圖像識(shí)別方法中,非監(jiān)督流形學(xué)習(xí)算法WLLE沒有利用到樣本的類別信息,同時(shí)測(cè)試樣本的低維嵌入通過已有訓(xùn)練樣本流形鄰域關(guān)系近似得到,限制了葉片圖像的識(shí)別精度。針對(duì)這兩個(gè)缺陷,本文提出了一種基于S-WLLE算法和SVR的植物葉片圖像識(shí)別方法,利用樣本監(jiān)督距離代替WLLE算法中的樣本歐式距離,從而充分挖掘樣本的類別信息;同時(shí),利用SVR對(duì)訓(xùn)練樣本的高維特征和低維嵌入進(jìn)行學(xué)習(xí)得到支持向量機(jī)回歸模型,精確預(yù)測(cè)測(cè)試樣本的低維嵌入。實(shí)驗(yàn)結(jié)果表明,本文提出的葉片圖像識(shí)別方法不僅提高了葉片圖像正負(fù)類樣本的識(shí)別率,而且能夠有效區(qū)分葉片圖像負(fù)負(fù)類樣本。
[1]Du J,Huang D,Wang X,et al.Shape recognition based on radial basis probabilistic neural network and application to plant species identification[M].Berlin:Springer-Verlag,2005:281-285
[2]Neto J C,Meyer G E,Jones D D,et al.Plant species identification using elliptic Fourier leaf shape analysis[J].Computers and Electronics in Agriculture,2006,50(2):121-134
[3]Lee C L,Chen S Y.Classification of leaf images[J].International Journal of Imaging Systems and Technology,2006,16(1):15-23
[4]Neto J C,Meyer G E,Jones D D,et al.Plant species identification using Elliptic Fourier leaf shape analysis[J].Computers and Electronics in Agriculture,2006,50(2):121-134
[5]杜吉祥,汪增福.基于徑向基概率神經(jīng)網(wǎng)絡(luò)的植物葉片自動(dòng)識(shí)別方法[J].模式識(shí)別與人工智能,2008,21(2):206-213
[6]Bruno O M,de Oliveira Plotze R,Falvo M,et al.Fractal dimension applied to plant identification[J].Inform Sci,2008,178(12):2722-2733
[7]孫永新.基于多尺度形狀分析的葉形識(shí)別系統(tǒng)[J].計(jì)算機(jī)應(yīng)用,2009,29(6):1707-1710
[8]張寧,劉文萍.基于圖像分析的植物葉片識(shí)別技術(shù)綜述[J].計(jì)算機(jī)應(yīng)用研究,2011,28(11):4001-4007
[9]張善文,王獻(xiàn)峰.基于加權(quán)局部線性嵌入的植物葉片圖像識(shí)別方法[J].農(nóng)業(yè)工程學(xué)報(bào),2011,27(12):141-145
[10]張善文,黃德雙.一種魯棒的監(jiān)督流形學(xué)習(xí)算法及其在植物葉片分類中的應(yīng)用[J].模式識(shí)別與人工智能,2010,23(6):836-841
[11]閻慶,梁棟,張晶晶.基于Fisher變換的植物葉片圖像識(shí)別監(jiān)督LLE算法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2012,43(9):179-183
[12]Roweis S T,Saul L K.Nonlinear dimensionality reduction by locally linear embedding[J].Science,2000,290:2323-2326
[13]Tenenbaum J B,De Silva V,Langford J C.A global geometric framework for nonlinear dimensionality reduction[J].Science,2000,290:2319-2323
[14]徐紅敏,王海英,梁瑾,等.支持向量機(jī)回歸算法及其應(yīng)用[J].北京石油化工學(xué)院學(xué)報(bào),2010,18(1):62-66
[15]力瓊.支持向量機(jī)回歸在傳染病預(yù)測(cè)中的應(yīng)用研究[D].江蘇:蘇州大學(xué)蘇州大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,2010:28
[16]Geng X,Zhan D C,Zhou Z H.Supervised nonlinear dimensionality reduction for visualization and classification[J].IEEE Transactions on SMC B,2005,35(6):1098-1107
[17]Hu Rong-xiang,Wei Jia,Huang De-shuang,et al.Maximum margin criterion with tensor representation[J].Neurocompution,2010,73(10/12):1541-1549
[18]李慧,祁力鈞,張建華,等.基于PCA-SVM的棉花出苗期雜草類型識(shí)別[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2011,43(9):184-189
(責(zé)任編輯:汪材印)
宿州學(xué)院“國(guó)家級(jí)工程技術(shù)研究中心”獲準(zhǔn)立項(xiàng)
日前,國(guó)家科技部發(fā)文公布了《關(guān)于2014年度國(guó)家工程技術(shù)研究中心立項(xiàng)的通知》,宿州學(xué)院與皖北煤電集團(tuán)、中國(guó)礦業(yè)大學(xué)(北京)共同組建申報(bào)的“國(guó)家煤礦水害防治工程技術(shù)研究中心(編號(hào):2014FU125Q06)”獲批立項(xiàng)。
An Exploration of Recognition Method of Plant Leaves Based on S-WLLE Algorithm and SVR
YANG Li,YE Ming-quan
Computer Teaching and Research Section,Wannan Medical College, Wuhu Anhui 241002, China
Weighted locally linear embedding algorithm can't mine adeqtely sample category information,and the low accuracy of traditional manifold learning algorithm uses existed manifold neighborhood of training sample to obtain test sample wity low embedding accuracy.this paper proposed a recognition method of plant leaves based on supervised weighted locally linear embedding algorithm and support vector regression.First,it used supervised distance to replace sample Euclidean distance in WLLE to reduce training sample dimensions. Then, it learned the training sample data to form SVR model to predict test sample's low dimension embedding.Finally,it recognized leaves between positive and negative and between negative and negative by the nearest classifier. The experimental results show that the proposed method not only improves the leaves classification accuracy between positive and negative sort of the leaves but also distinguishes two negative sorts of the leaves effectively.
leaves recognition;supervised distance;weighted locally linear embedding;dimension reducing;support vector regression
10.3969/j.issn.1673-2006.2014.11.021
2014-05-04
國(guó)家自然科學(xué)基金面上項(xiàng)目“網(wǎng)絡(luò)環(huán)境下數(shù)字圖像可信性度量理論與方法研究”(61272540);安徽省高校省級(jí)自然科學(xué)研究重點(diǎn)項(xiàng)目“面向腫瘤基因表達(dá)數(shù)據(jù)的特征選擇與集成分類研究”(KJ2014A266)。
楊利(1984-),安徽池州人,碩士,助教,主要研究方向:模式識(shí)別、信息檢索。
TP391.41
A
1673-2006(2014)11-0069-06