黃林生,劉文靜,2,黃文江,2※,趙晉陵,宋富冉,2
(1. 安徽大學安徽省農業(yè)生態(tài)大數據工程實驗室,合肥 230601;2. 中國科學院遙感與數字地球研究所,數字地球重點實驗室,北京 100094)
·農業(yè)信息與電氣技術·
小波分析與支持向量機結合的冬小麥白粉病遙感監(jiān)測
黃林生1,劉文靜1,2,黃文江1,2※,趙晉陵1,宋富冉1,2
(1. 安徽大學安徽省農業(yè)生態(tài)大數據工程實驗室,合肥 230601;2. 中國科學院遙感與數字地球研究所,數字地球重點實驗室,北京 100094)
為利用遙感影像數據在區(qū)域尺度上實現快速、準確地監(jiān)測小麥白粉病的發(fā)生、發(fā)展情況,該研究基于環(huán)境與災害監(jiān)測預報小衛(wèi)星(HJ-1A/1B)數據對地表溫度(land surface temperature,LST)進行反演、提取4個波段反射率數據并構建 7個植被指數。耦合K-mean和 Relief算法對小麥白粉病遙感特征進行篩選。通過支持向量機(support vector machine,SVM)與小波特征(Gabor)結合SVM(GaborSVM)的方法分別建立河北省晉州市小麥白粉病發(fā)生監(jiān)測模型,并對2種模型的監(jiān)測精度進行對比。結果表明:歸一化植被指數(normalized difference vegetation index,NDVI)、比值植被指數(simple ratio index,SR)和地表溫度3種特征參量可較好地表征小麥白粉病的發(fā)生情況,GaborSVM的總體精度達到86.7%,優(yōu)于SVM的80%。因此,小波分析與支持向量機結合的方法可用于基于衛(wèi)星遙感影像的大面積病害監(jiān)測,對提高病害監(jiān)測精度具有重要應用價值。
遙感;支持向量機;病害;白粉??;小波特征
小麥白粉病嚴重影響小麥產量,據統(tǒng)計,白粉病危害一般可使小麥減產5%~10%,嚴重區(qū)域可達20%以上[1]。準確獲取病害發(fā)生狀況和其空間分布對于病害防治是十分必要的,傳統(tǒng)的病蟲害監(jiān)測主要依靠植保人員的田間調查和田間取樣等方式,盡管這些傳統(tǒng)方法的真實性和可靠性較高,但耗時、費力,難以適應目前大范圍的病蟲害實時監(jiān)測和預報的需求,因此有必要建立基于遙感影像的監(jiān)測模型[2]。
目前,一些學者利用遙感寬波段數據對病蟲害進行了一系列研究。馬慧琴等[1]利用Landsat 8遙感影像數據結合氣象數據采用相關向量機的模型實現小麥白粉病的區(qū)域尺度監(jiān)測,證明了遙感影像數據單獨使用無法得到滿足需求的試驗結果,需與氣象數據結合分析。Huang等[3-4]發(fā)現小麥白粉病由于光譜響應總體上較平滑,不同于某些僅在較窄波段范圍內發(fā)生響應的病害,因此采用寬波段的光譜特征識別白粉病是可行的。Luo等[5]利用LST(land surface temperature)等數據構建二維特征空間對小麥蚜蟲進行了預測,發(fā)現LST對蚜蟲是否發(fā)生起決定性作用,是蚜蟲發(fā)生發(fā)展的一個關鍵性因子。張競成等[6-8]研究了小麥白粉病主要的敏感波段及敏感植被指數。以上分析表明寬波段植被指數對于病害識別是有可用性的,但寬波段植被指數所含信息較為籠統(tǒng),單獨使用無法得到滿意的試驗結果。因此嘗試對寬波段植被指數進行進一步細化研究,從而得到更多有用信息,提高分類精度。小波分析是多種分析的結合算法,能夠從多尺度、多方向上分解數據[9],實現對數據的細化分析。魯軍景等[10]利用航空遙感高光譜數據采用小波分析的方法識別小麥白粉病的敏感波段,并得到了較高的識別精度,高光譜數據包含大量細節(jié)信息,證明小麥白粉病在細節(jié)信息中有較好體現,但航空遙感高光譜數據在大范圍尺度的監(jiān)測上存在一定局限性。以下分析采用不同的源數據,在進行識別分類時利用小波分析來提取細節(jié)信息,均達到了提高識別精度的目的。Chen等[11]在對地震信號譜分解中先尋找小波變換的最優(yōu)旋轉因子,再進行處理,降低了算法的運算復雜度,并得到較好的試驗結果。印勇等[12]在對人臉表情識別時采用了PCA(principal component analysis)算法對小波特征進行降維處理,提高了算法的運算效率及精度。牛連強等[13]在表情識別試驗中,利用 LBP(local binary patterns)算法結合小波變換的方法,大幅度降低了特征的維數,并提高了特征提取的準確性,得到了100%的識別率。上述3組研究表明小波分析算法在圖像識別領域有較高的應用價值,但目前尚未出現小波分析應用于寬波段植被指數提取病害信息方面的研究,因此嘗試將小波變換(Gabor)應用于寬波段植被指數,并對得到的小波特征進行篩選,突出對病害敏感的因子,以提高病害識別精度。
支持向量機在機器學習領域通常用來模式識別、分類及回歸分析,此算法結構穩(wěn)定,使用方便,相較于人工神經網絡等其他算法具有能夠獲得全局最優(yōu)解的優(yōu)點[14-15]。Wang等[16]利用支持向量機模型對小麥條銹病進行分類和識別,獲得了 97%的識別精度。袁瑩等[17]利用 SVM(support vector machine)模型對玉米顆粒霉變程度進行判別,準確率達到91%。張錄達等[18]利用SVM對小麥蛋白質含量進行了預測,并得到了較好的分析結果。以上SVM模型在小范圍病害數據分類識別中具有較高的應用價值,但未嘗試使用小波變換結合SVM在大區(qū)域尺度的小麥白粉病識別中進行應用,本研究將二者結合進行試驗分析,實現區(qū)域尺度的小麥白粉病發(fā)生分布的監(jiān)測。
基于以上分析,本文以河北晉州市為研究對象,嘗試僅利用環(huán)境星遙感數據經過小波變換及特征篩選后,結合SVM算法建立的監(jiān)測模型(GaborSVM),最終實時準確獲取大面積小麥白粉病發(fā)生的空間分布特征,為白粉病防治提供依據,提高農藥的使用效率,從而有助于糧食產量的提高。
小麥白粉病監(jiān)測的具體操作流程如圖1所示。
圖1 小麥白粉病監(jiān)測流程圖Fig.1 Flow chart of wheat powdery mildew monitoring
1.1 研究區(qū)概況
本研究區(qū)位于河北省石家莊市的晉州(114°58′E~115°12′E,37°48′N~38°10′N)(如圖 2),該區(qū)域屬于黃河流域白粉病易發(fā)氣候區(qū),晉州市地處滹沱河和滏陽河沖積扇的交匯處,地勢平緩開曠且全境皆平原,由于此地地勢平坦,氣候單一,同時種植結構較單一,適合利用遙感衛(wèi)星影像來展開小麥白粉病監(jiān)測。
1.2 數據獲取
研究所用數據主要包括遙感數據和小麥白粉病實地調查數據。遙感數據為環(huán)境與災害監(jiān)測預報小衛(wèi)星星座A、B(HJ-1A/1B星)數據,根據研究區(qū)天氣狀況,選擇質量較好、時間最接近地面調查的影像數據,即2014年5月29日的CCD光學數據和IRS熱紅外數據,其詳細的載荷信息如表1所示。小麥白粉病實地調查數據于2014年5月27、28日(小麥灌漿期)于晉州調查獲得,在選擇調查點區(qū)域時,觀察到晉州市內的白粉病發(fā)生情況類似,故希望選擇一處具有代表性的地塊做調查,周家莊是全國僅存的人民公社,此處處于種植區(qū)域的中部最大且集中種植小麥的地塊,滿足衛(wèi)星影像處理的要求,同時此處的小麥白粉病發(fā)生情況較均勻,發(fā)生了不同等級的小麥白粉病,相較于其他區(qū)域更具有代表性。野外調查共得40個有效數據,調查方法參見文獻[19]。
圖2 研究區(qū)概況Fig.2 General situation of study area
表1 HJ-1A/1B衛(wèi)星主要載荷參數信息Table 1 Specifications of multispectral remote sensors onboard HJ-1A and 1B satellites
1.3 數據處理
獲取的環(huán)境星CCD影像、IRS影像需要經過輻射定標、大氣校正和影像裁剪,并結合Landsat8影像進行幾何校正等預處理。環(huán)境星影像輻射定標公式如下:
式中L為輻射亮度,β為絕對定標系數增益,L0為偏移量,DN為遙感影像像元亮度值。
輻射定標系數來源于中國資源衛(wèi)星應用中心,之后完成相應傳感器的波普響應函數待用,并采用 ENVI5.1軟件中FLAASH模塊完成影像的大氣校正,最后對校正后圖像進行裁剪獲取研究區(qū)影像。
預處理完成后,根據研究區(qū)的作物類型利用NDVI、數字高程模型(digital elevation model,DEM)、近紅外反射率數據,并結合 ENVI5.1監(jiān)督分類中的最大似然分類提取冬小麥的種植區(qū)域[1]。
利用環(huán)境星影像數據選取對小麥白粉病較敏感的 7個寬波段植被指數[5](表2)和紅、綠、藍和近紅外4個波段反射率數據,以及采用單通道算法反演得到的 LST數據[20-21]作為白粉病監(jiān)測模型的初選特征。
表2 寬波段植被指數Table 2 Wide-band vegetation index
1.4 建模特征選擇
在模型構建時選擇最能反映病害發(fā)生發(fā)展狀況的特征變量可以有效提高模型的準確度。本文在建模特征選擇時主要包括2個部分內容。首先是針對提取的12個植被指數特征數據進行特征優(yōu)選,得出最佳特征組合,并用于模型構建。其次,為了進一步凸顯健康小麥與病害小麥的區(qū)別,將篩選出的特征變量進行小波變換,得到一組反映指數特征某種局部細節(jié)的小波特征集,同時對其進行二次篩選得到一組最佳小波特征作為監(jiān)測模型的輸入變量,具體的實現過程如下。
1.4.1 寬波段植被指數篩選
Relief算法是一種特征權重算法,通過計算特征與類別間的相關性賦予特征不同的權重,但是Relief算法不能識別類別間的冗余以及特征間的相互負作用,聚類分析可以得到不同特征對樣本的聚類精度,可根據聚類分析的精度來提取最高聚類精度的特征集合,因此研究采用Relief算法[29-30]結合K-mean算法[31-32]的方法對植被指數特征進行篩選,得出最佳的特征組合,其中聚類分析通過MATLAB中的K-means函數實現。具體的操作過程為根據Relief算法將特征數據按權重降序排序,將排序后的特征依次組合進行聚類分析,具體做法為:①選擇 NDVI進行聚類分析;②選擇NDVI、SR進行聚類分析;③選擇NDVI、SR、SAVI進行聚類分析,按照特征權重排序依次類推。將取得的聚類精度最大的特征集合用于建模分析。表3列舉出了各個特征的Relief特征權重、K-mean獨個特征聚類精度及特征組合聚類精度,由第三行數據可知在組合到 SAVI時精度開始下降,在 LST時有上升。選擇NDVI、SR和LST再次進行聚類分析,精度為0.7451,選擇NDVI和LST與SR和LST分別進行聚類分析,精度均為0.6078。最終選擇NDVI、SR和LST用于模型的構建。
1.4.2 Gabor小波變換及小波特征篩選
盡管寬波段植被指數可以表達出小麥白粉病的相關特征,但由于寬波段植被指數本身的特點,運用的波段范圍較大,存有誤差,因此有必要對其細節(jié)信息進行進一步的濾波提取。小波變換可以實現對數據的濾波、去噪等優(yōu)化。張競成[6]在對小麥白粉病葉片光譜特征的研究中發(fā)現小波特征與病情嚴重度有較強的相關性,因此小波特征在區(qū)域尺度白粉病識別上可以嘗試利用。小波變換具有多分辨率特性,采用多通道濾波,每個通道都可以得到數據的某種局部細節(jié)特征,突出數據的敏感信息,故而在某種程度上優(yōu)化了對光譜信息的利用。將篩選得到的NDVI、SR和LST進行小波變換,并從變換得到的小波特征集中篩選出對有無小麥白粉病區(qū)別最大的小波特征,將其用于小麥白粉病的分類識別以提高識別精度。
表3 各個特征的Relief特征權重、K-mean聚類精度、特征組合精度Table 3 Feature weights by Relief, clustering precision by K-mean and precision by combined features
Gabor小波能同時對時間和頻率進行局部分析,這使得對平穩(wěn)信號的分析更加容易,對 Gabor利用傅立葉展開,就是利用時間和頻率同時定義一個時間函數的方法,而Gabor小波變換就是求解Gabor的展開系數[33]。本研究采用高斯核函數作為母小波構建小波核函數將植被指數特征與小波核函數進行卷積運算,卷積后的幅值作為建模特征信息,在農業(yè)應用方面通常采用高斯函數作為母小波函數構建小波核函數[34]:
式中(,)g x y為高斯調制函數,xσ和yσ為其在(,)x y2個坐標軸上的標準差, (,)h x y為小波函數,W為復正弦函數在橫軸上的頻率, ( )H u,v為小波函數的傅立葉變換形式,u為頻域中的自變量頻率,v為對應頻率信號的幅度值,uσ和vσ為其在()u,v2個坐標軸上的標準差。
式中(h*I)表示濾波器h與數據I的卷積,hR表示濾波器h的實部,hI表示濾波器h的虛部,S(x,y)即為經過Gabor濾波器得到的特征。以h(x,y)為母小波,對其進行尺度和旋轉變換,可以得到一組自相似的濾波器:
本試驗中t=5,K=8,α=。
因此,研究共構建5個尺度8個方向共40個小波核函數,使得小波變換后的數據量擴大為原來的40倍。為了找到最佳分類的小波特征,同時去除特征維數過多對模型運算效率的影響[35],對小波特征進行了進一步篩選。研究采用獨立樣本T檢驗的方式對小波特征進行篩選處理[10,33,36]。
經過獨立樣本T檢驗選擇對有無病害具有顯著性差異(P<0.001)且T統(tǒng)計的相伴概率最小的小波特征構建監(jiān)測模型,并得到其對應的小波核函數。
m、n及對應的尺度因子和旋轉角度如表4所示。
表4 最佳小波函數的參數Table 4 Parameters of optimal wavelet function
1.5 模型構建
支持向量機是基于統(tǒng)計學習理論的一種機器學習方法,它的核心思想是結構風險最小化,通過核函數把輸入線性不可分的數據映射到高維空間,構造超平面,使得不同樣本之間的類間隔最大,類內間隔最小,它具有結構簡單、適應性強、全局最優(yōu)等特點,能較好的解決高維特征、非線性、過學習與不確定性等問題,廣泛應用于遙感影像分類中[37]。該模型的判別函數為
式中ai為 Lagrange乘子,SV為支持向量,xi、yi為 2類中的支持向量,b為閾值,其中k(xi,x)為滿足Mercer定理的正定核函數[37-40]。
本研究基于SVM算法共建立3個模型,第一個模型利用全部的12個植被指數結合SVM算法建立對照試驗,第二個模型對12個植被指數進行指數篩選,用得到3個植被指數結合SVM算法建立模型,第三個模型在第二個模型的基礎上對3個植被指數進行Gabor小波變換,再對得到的小波特征進行篩選,用得到的小波特征結合SVM建立模型(GaborSVM),利用Gabor小波變換在敏感特征提取方面的優(yōu)勢和支持向量機在小樣本分類中的優(yōu)勢以提高監(jiān)測模型的精度和效率。
本試驗共獲得40個發(fā)生白粉病的調查點數據,調查時將其分為0(無病害)、1(輕度)、2(中度)、3(重度)、4(特重)共5個等級。由于無病害與輕度較難區(qū)分,故將以上 5類樣本分為健康(無病害、輕度)和病害(中度、重度和特重)2類。其中25個為訓練樣本構建模型,15個為測試樣本用于模型的驗證。
2.1 研究區(qū)小麥白粉病監(jiān)測
利用2014年5月29日的影像數據,以單個像元為單位,利用Relief算法與K-mean聚類相結合的方式篩選出3個特征指數NDVI、LST和SR,分別利用SVM模型及GaborSVM模型得到2014年5月29日的小麥白粉病發(fā)生分布情況如圖3所示,圖3a為將全部12個植被指數運用SVM模型預測結果,圖3b為經過特征篩選后采用NDVI、LST、SR的SVM監(jiān)測結果,圖3c為分別對NDVI、LST、SR小波變換后,利用經過獨立樣本T檢驗得到的最優(yōu)小波特征進行SVM的監(jiān)測結果。從圖3中可以看出3種監(jiān)測模型的白粉病發(fā)生情況的總體空間分布相似,東部發(fā)病情況較西部嚴重。而發(fā)病面積占總種植面積的百分比圖3a為49%、圖3b為45%和圖3c為38%。圖3a與其余2幅圖相比,白粉病的發(fā)生情況較為零散。圖3b與圖3c大體相同,呈現整塊的區(qū)域分布,僅在某些細小部位存在區(qū)別:在圖3b中處于健康區(qū)域內的小塊病害區(qū)域,在圖3c中部分被分為健康區(qū)域。而小麥白粉病是由布氏白粉菌引起的,具有繁殖快,傳播面廣的特點[41]。因此,在小麥灌漿期白粉病零散發(fā)生的概率較低。由此可以間接得出SVM結合特征篩選模型與GaborSVM結合特征篩選模型的可信度高于SVM未經特征篩選模型并且GaborSVM結合特征篩選模型相較于SVM結合特征篩選模型有了一定的改善。
從整體上看 3個模型的空間分布相類似,為了進一步觀察監(jiān)測結果,可以從局部圖中查看。圖 4為小麥白粉病在調查點區(qū)域的監(jiān)測結果圖。1號、2號區(qū)域實際調查結果均為健康區(qū)域。圖4a在利用SVM建模在1號區(qū)域中得到的監(jiān)測結果為染病,在 2號區(qū)域中的到的監(jiān)測結果為染病病區(qū)域大于健康區(qū)域;圖4b在特征篩選后利用SVM建模在1號區(qū)域中得到的監(jiān)測結果為健康,在2號區(qū)域中的到的監(jiān)測結果為染?。粓D4c利用GaborSVM建模在1號區(qū)域與2號區(qū)域中得到的監(jiān)測結果均為健康。GaborSVM模型的監(jiān)測結果與實際調查結果最相似,在局部圖中4a中小麥白粉病分布零散,而圖4b、c中小麥白粉病分布較集中,這與總體分析結果相一致。因此GaborSVM模型可適用于小麥白粉病監(jiān)測。
圖3 小麥白粉病監(jiān)測結果空間分布圖Fig.3 Monitoring spatial map of wheat powdery mildew
圖4 小麥白粉病監(jiān)測結果空間局部分布圖Fig.4 Monitoring spatial local map of wheat powdery mildew
2.2 模型的評估與驗證
采用獨立的樣本數據對模型進行驗證能夠更好地體現實際模型的精度[12]。本試驗采用2014年5月27、28日的白粉病的地面調查點數據對模型監(jiān)測結果進行評價。表5中列出了SVM模型與GaborSVM結合Relief算法與K-mean聚類的用戶精度、總體精度和Kappa系數。從結果中可以看出3組試驗都獲得了較好的試驗結果。
從總體精度上看,SVM 模型的總體精度低于GaborSVM模型,說明Gabor小波特征相較于原始植被指數特征對病害的識別率較高,GaborSVM 模型的 Kappa系數也達到0.583,高于2個SVM模型的0.286和0.444。并且在2個SVM模型中,通過特征篩選的SVM模型精度高于未進行特征篩選的SVM模型,可以推測是由于去除了冗余特征及負相關特征所致。從用戶精度來看,3組模型中病害的用戶精度分別為 50%、83.3%、91.7%,表明3個模型對病害的識別精度在不斷提高,GaborSVM的用戶精度達到91.7%,表明此模型能較為準確的識別病害樣本。以上結果表明,小波特征能提高監(jiān)測模型對健康與病害的區(qū)分精度,且特征篩選有助于提高模型精度。
表5 總體驗證結果Table 5 Overall verification results
1)特征篩選結合SVM模型比SVM模型總體精度從60%提高到80%,說明去除特征間的冗余性確實可以提高模型精度與效率;GaborSVM模型的總體精度達到86.7%,此模型與特征篩選結合SVM模型相比總體精度從80%提高到86.7%,說明小波變換應用于植被指數可以提高小麥白粉病的監(jiān)測精度。
2)GaborSVM模型的Kappa系數為0.583為SVM模型0.286的1倍多,GaborSVM模型的Kappa系數與特征篩選結合SVM模型相比也有明顯提高,說明GaborSVM模型的一致性有了明顯的提高,在實際應用中更為可靠。此實驗結果滿足農業(yè)部門對小麥白粉病發(fā)生及時監(jiān)測的需求,可指導其及時制定相關的應對治理措施,減少產量損失,提高經濟效益。
訓練樣本的質量和數量會影響模型的精度,本研究開展時由于成本限制,地域限制,采樣量不足,僅獲取了河北石家莊的小部分區(qū)域的數據,因此模型的通用性有待進一步驗證。初步選取的植被特征指數不完整,可選擇更多敏感指數進行試驗,以提高試驗精度。選用的因子均來自遙感數據,未選用其他影響病害發(fā)生發(fā)展的氣象因子、農田管理信息等,這一方面降低了數據獲取難度,但另一方面可能會影響模型的精度,在今后的研究中可以融合更多數據,對比分析試驗,找到既易獲取、易處理又能提高精度的數據來構建監(jiān)測模型。研究在建立監(jiān)測模型時使用了 GaborSVM 算法,一方面由于GaborSVM模型的測試地點處于平原區(qū)域,在復雜地形的情況下仍需進一步測試,模型的可移植性仍需驗證。另一方面 Gabor特征在建模前需對其進行進一步篩選,而篩選算法可以有進一步改進測試,以得到更多有效特征,提高識別精度和數據處理效率。
[1] 馬慧琴,黃文江,景元書.遙感與氣象數據結合預測小麥灌漿期白粉病[J].農業(yè)工程學報,2016,32(9):165-172.Ma Huiqin, Huang Wenjiang, Jing Yuanshu. Wheat powdery mildew forecasting in filling stage based on remote sensing and meteorological data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(9): 165-172. (in Chinese with English abstract)
[2] Sankaran S, Mishra A, Ehsani R, et al. A review of advanced techniques for detecting plant diseases[J]. Computers and Electronics in Agriculture, 2010, 72(1): 1-13.
[3] Huang W, Lamb D W, Niu Z, et al. Identification of yellow rust in wheat using in-situ spectral reflectance measurements and airborne hyperspectral imaging[J]. Precision Agriculture,2007, 8(4/5): 187-197.
[4] Devadas R, Lamb D W, Simpfendorfer S, et al. Evaluating ten spectral vegetation indices for identifying rust infection in individual wheat leaves[J]. Precision Agriculture, 2009, 10(6):459-470.
[5] Luo Juhua, Zhao Chunjiang, Huang Wenjiang, et al.Discriminating wheat aphid damage degree using 2-dimensional feature space derived from landsat 5 TM[J]. Sensor Letters,2012, 10(1/2): 608-614.
[6] 張競成.多源遙感數據小麥病害信息提取方法研究[D].杭州:浙江大學,2012.Zhang Jingcheng. Methods for Information Extraction of Wheat Disease Based on Multi-source Remote Sensing Data[D]. Hangzhou: Zhejiang University, 2012. (in Chinese with English abstract)
[7] Zhang Jingcheng, Pu Ruiliang, Wang Jihua, et al. Detecting powdery mildew of winter wheat using leaf level hyperspectral measurements[J]. Computers and Electronics in Agriculture,2012, 85: 13-23.
[8] Zhang Jingcheng, Pu Ruiliang, Yuan Lin, et al. Monitoring powdery mildew of winter wheat by using moderate resolution multi-temporal satellite imagery[J]. PloS one, 2014, 9(4):e93107.
[9] 崔海濱,楊柯,張龍,等.基于Gabor變換的TDLAS檢測信號的降噪研究[J].光譜學與光譜分析,2016,36(9):2997-3002.Cui Haibing, Yang Ke, Zhang Long, et al. Tunable diode laser absorption spectroscopy (TDLAS) detection signal denoising based on gabor transform[J]. Spectroscopy and Spectral Analysis, 2016, 36(9): 2997-3002. (in Chinese with English abstract)
[10] 魯軍景,黃文江,張競成,等.基于小波特征的小麥白粉病與條銹病的定量識別[J].光譜學與光譜分析,2016,36(6):1854-1858.Lu Junjing, Huang Wenjiang, Zhang Jingcheng, et al.Quantitative identification of yellow rust and powdery mildew in winter wheat based on wavelet feature[J].Spectroscopy and Spectral Analysis, 2016, 36(6): 1854-1858. (in Chinese with English abstract)
[11] Chen Y P, Peng Z M, He Z H, et al. The optimal fractional Gabor transform based on the adaptive window function and its application[J]. Applied Geophysics, 2013, 10(3): 305-313.
[12] 印勇,史金玉,劉丹平.基于 Gabor 小波的人臉表情識別[J].光電工程,2009,36(5): 111-116.Ying yong, Shi Jingyu, Liu Danping. Facial expression recognition based on Gabor wavelet transform[J].Photoelectric engineering, 2009, 36(5): 111-116. (in Chinese with English abstract)
[13] 牛連強,趙子天,張勝男.基于 Gabor 特征融合與 LBP直方圖的人臉表情特征提取方法[J].沈陽工業(yè)大學學報,2016,38(1):63-68.Niu Lianqiang, Zhao Zitian, Zhang Shengnan. Extraction method for facial expression features based on Gabor feature fusion and LBP hiatogram[J]. Journal of Shenyang University of Technology, 2016, 38(1): 63-68. (in Chinese with English abstract)
[14] 王道明,魯昌華,蔣薇薇,等.基于粒子群算法的決策樹SVM 多分類方法研究[J].電子測量與儀器學報,2015,29(4):611-615.Wang Daoming, Lu Changhua, Jiang Weiwei, et al. Study on PSO-based decision-tree SVM multi-class classification method[J]. Journal of Electronic Measurement and Instrumentation, 2015, 29(4): 611-615. (in Chinese with English abstract)
[15] 陳中杰,蔡勇,蔣剛.復高斯小波核函數的支持向量機研究[J].計算機應用研究,2012,29(9):3263-3265.Chen Zhongjie, Cai Yong, Jiang Gang. Study on SVM of complex Gaussian wavelet kernel function[J]. Journal of Computer Applications, 2012, 29(9): 3263-3265. (in Chinese with English abstract)
[16] Wang H G, Ma Z H, Wang T, et al. Application of hyperspectral data to the classification and identification of severity of wheat stripe rust (in Chinese) [J]. Spectroscopy and Spectral Analysis , 2007, 27(9): 1811-1814.
[17] 袁瑩,王偉,褚璇,等.光譜特征波長的 SPA 選取和基于 SVM 的玉米顆粒霉變程度定性判別[J].光譜學與光譜分析,2016,36(1):226-230.Yuan Ying, Wang Wei, Chu Xuan, et al. Selection of characteristic wavelengths using SPA and qualitative discrimination of mildew degree of corn kernels based on SVM[J]. Spectroscopy and Spectral Analysis, 2016, 36(1):226-230. (in Chinese with English abstract)
[18] 張錄達,金澤宸,沈曉南,等.SVM 回歸法在近紅外光譜定量分析中的應用研究[J].光譜學與光譜分析,2005,25(9):1400-1403.Zhang Luda, Jin Zechen, Shen Xiaonan, et al. Applied study on support vector machine (SVM) regression method in quantitative analysis with near-infrared spectroscopy[J].Spectroscopy and Spectral Analysis, 2005, 25(9): 1400-1403. (in Chinese with English abstract)
[19] Luo J, Wang D, Dong Y, et al. Developing an aphid damage hyperspectral index for detecting aphid (Hemiptera:Aphididae) damage levels in winter wheat[C]//Geoscience and Remote Sensing Symposium (IGARSS), 2011 IEEE International. Ieee, 2011: 1744-1747.
[20] 徐涵秋.新型 Landsat8 衛(wèi)星影像的反射率和地表溫度反演[J].地球物理學報,2015,58(3):741-747.Xu Hanqiu. Retrieval of the reflectance and land surface temperature of newly-launched Landsat 8 satellite[J]. Chinese Journal of Geophysics, 2015, 58(3): 741-747. (in Chinese with English abstract)
[21] Jiménez-Mu?oz J C, Sobrino J A. A generalized singlechannel method for retrieving land surface temperature from remote sensing data[J]. Journal of Geophysical Research:Atmospheres, 2003, 108(D22): ACL2.1-ACL2.9.
[22] Verstraete M M, Pinty B, Myneni R B. Potential and limitations of information extraction on the terrestrial biosphere from satellite remote sensing[J]. Remote Sensing of Environment, 1996, 58(2): 201-214.
[23] Chen S F, Goodman J. An empirical study of smoothing techniques for language modeling[C]//Proceedings of the 34th annual meeting on Association for Computational Linguistics. Association for Computational Linguistics, 1996:310-318.
[24] Rouse B T, Wells R J H, Warner N L. Proportion of T and B lymphocytes in lesions of Marek's disease: theoretical implications for pathogenesis[J]. The Journal of Immunology,1973, 110(2): 534-539.
[25] Rondeaux G, Steven M, Baret F. Optimization of soil-adjusted vegetation indices[J]. Remote Sensing of Environment, 1996, 55(2): 95-107.
[26] Roujean J L, Breon F M. Estimating PAR absorbed by vegetation from bidirectional reflectance measurements[J].Remote sensing of Environment, 1995, 51(3): 375-384.
[27] Huete A R. A soil-adjusted vegetation index (SAVI) [J].Remote sensing of environment, 1988, 25(3): 295-309.
[28] Person R S, Kudina L P. Discharge frequency and discharge pattern of human motor units during voluntary contraction of muscle[J]. Electroencephalography and Clinical Neurophysiology,1972, 32(5): 471-483.
[29] Kohavi R, John G H. Wrappers for feature subset selection[J].Artificial Intelligence, 1997, 97(1): 273-324.
[30] Kira K, Rendell L A. The feature selection problem:Traditional methods and a new algorithm[C]//AAAI. 1992, 2:129-134.
[31] 孫吉貴,劉杰,趙連宇.聚類算法研究[J].軟件學報,2008,19(1):48-61.
[32] 王千,王成,馮振元,等.K-means 聚類算法研究綜述[J].電子設計工程,2012,20(7):21-24.
[33] 葉超.基于 Gabor 小波和 SVM 的人臉識別算法研究[D].太原:中北大學,2014.Ye Chao. The Optimization Algorithm of Face Recognition Based on Gabor Wavelets and SVM[D]. Taiyuan: North University of China, 2014. (in Chinese with English abstract)
[34] 魯軍景,黃文江,蔣金豹,等.小波特征與傳統(tǒng)光譜特征估測冬小麥條銹病病情嚴重度的對比研究[J].麥類作物學報,2015,35(10):1456-1461.Lu Junjing,Huang Wenjiang,Jiang Jinbao, et al. Comparison of wavelet features and conventional spectral features on estimating severity of stripe rust in winter wheat[J]. Journal of Microbiology, 2015, 35(10): 1456-1461. (in Chinese with English abstract)
[35] 張麗新.高維數據的特征選擇及基于特征選擇的集成學習研究[D].北京:清華大學,2004.Zhang Lixin. Study on Feature Selection and Ensemble Learning Based on Feature Selection for High-Dimensional Datasets[D]. Beijing: Tsinghua University,2004. (in Chinese with English abstract)
[36] 鄧曾,李丹,柯櫻海,等.基于改進 SVM 算法的高分辨率遙感影像分類[J].國土資源遙感,2016,28(3):12-18.
[37] 何東健,喬永亮,李攀,等.基于 SVM-DS 多特征融合的雜草識別[J].農業(yè)機械學報,2013,44(2):182-187.He Dongjiang, Qiao Yongliang, Li Pan, et al. Weed recognition based on SVM-DS multi-feature fusion[J].Journal of agricultural machinery, 2013, 44(2): 182-187. (in Chinese with English abstract)
[38] 張學工.關于統(tǒng)計學習理論與支持向量機[J].自動化學報,2000,26(1):32-42.
[39] Huang D Y, Hu W C, Chang S H. Vision-based hand gesture recognition using PCA+ Gabor filters and SVM[C]//Intelligent Information Hiding and Multimedia Signal Processing, 2009. IIH-MSP'09. Fifth International Conference on. IEEE, 2009: 1-4.
[40] Sun Z, Bebis G, Miller R. On-road vehicle detection using Gabor filters and support vector machines[C]//Digital Signal Processing, 2002. DSP 2002. 2002 14th International Conference on. IEEE, 2002, 2: 1019-1022.
[41] 鄭秋紅,楊霏云,朱玉潔.小麥白粉病發(fā)生氣象條件和氣象預報研究進展[J].中國農業(yè)氣象,2013,34(3):358-365.Zheng Qiuhong, Yang Feiyun, Zhu Yujie. Meteorological factors and its forecast on wheat powdery mildew occurrence in China[J]. Chinese Journal of Agrometeorology, 2013,34(3): 358-365. (in Chinese with English abstract)
Remote sensing monitoring of winter wheat powdery mildew based on wavelet analysis and support vector machine
Huang Linsheng1, Liu Wenjing1,2, Huang Wenjiang1,2※, Zhao Jinling1, Song Furan1,2
(1.Anhui Engineering Laboratory of Agro-Ecological Big Data, Anhui University, Hefei230601,China;2.Key Laboratory of Digital Earth Science, Institute of Remote Sensing and Digital Earth,Chinese Academy of Sciences, Beijing100094,China)
Wheat powdery mildew is one of the main serious diseases for winter wheat. A fast and accurate monitoring of the disease at a regional scale plays a vital role in reducing yield loss. Remote sensing data has great advantages over traditional data in disease monitoring, including simpler operation, more real-time and higher resolution. In this study, Chinese HJ-1A/1B data with high revisit frequency and 30 m spatial resolution was used to inverse Land Surface Temperature (LST), extract four-band reflectance data, and build seven vegetation indices. These indices should be filtrated to improve accuracy of the model due to redundancy of them. Then, we implemented screening features with the combination of Relief andK-mean algorithm. Relief algorithm which can provide the basis for feature evaluation, so features were ranked in descending order judged by feature weights in preparation for the next process. Clustering accuracy obtained byK-mean algorithm. According to the weight of the feature, the features clustered in turn to performK-mean analysis. Then the cluster with the highest precision was picked out, and we finally got the normalized difference vegetation index (NDVI), Simple vegetation index (SR) and surface temperature (LST) as the feature set. Wavelet feature can decompose the data in multi-scale and multi-direction, which can highlight the sensitive factor of vegetation index to a certain extent. Forty wavelet functions were constructed from five scales and eight directions, and made them convolve with features. Because there were too many wavelet features after convolved, the independent T-test samples were used to obtain the most sensitive wavelet feature of disease and the corresponding wavelet kernel function. After this process, three features corresponding to vegetation indices were available.These three wavelet features were used as input variables of the model. Support vector machine is a kind of machine learning method based on statistical learning theory. Its core idea is to minimize the structural risk by mapping the input linear indivisible data to the high dimensional space, which makes the difference between different samples. The class interval is the largest while the intra-class interval is the smallest, then the hyper plane is constructed to classify data. The monitoring model of wheat powdery mildew in Jinzhou City of Hebei Province was established by using support vector machine (SVM) with three groups of features. The first group used twelve vegetation indices as the input variables of the model, which served as a control group. The second one used three features after feature selection and the third used three features of the wavelet transform. Then the monitoring precision of the three models was compared and analyzed. The experimental results showed that the overall accuracy and the kappa coefficient of the third model (called GaborSVM) were 86.7% and 0.583, respectively,performing better over the first model (60%, 0.286) and the second model (80%, 0.444). These results also showed that the combined method of wavelet analysis with SVM (GaborSVM) can be applied to large area disease monitoring based on satellite remote sensing image, and has important application value in improving the accuracy of disease monitoring.
remote sensing; support vector machine; diseases; powdery mildew; wavelet feature
10.11975/j.issn.1002-6819.2017.14.026
TP79
A
1002-6819(2017)-14-0188-08
黃林生,劉文靜,黃文江,趙晉陵,宋富冉. 小波分析與支持向量機結合的冬小麥白粉病遙感監(jiān)測[J]. 農業(yè)工程學報,2017,33(14):188-195.
10.11975/j.issn.1002-6819.2017.14.026 http://www.tcsae.org
Huang Linsheng, Liu Wenjing, Huang Wenjiang, Zhao Jinling, Song Furan. Remote sensing monitoring of winter wheat powdery mildew based on wavelet analysis and support vector machine[J]. Transactions of the Chinese Society of Agricultural Engineering(Transactions of the CSAE), 2017, 33(14): 188-195. (in Chinese with English abstract)
doi:10.11975/j.issn.1002-6819.2017.14.026 http://www.tcsae.org
2017-01-03
2017-07-07
安徽省自然科學基金(1608085MF139);安徽省科技重大專項(16030701091);中國科學院國際合作局對外合作重點項目(131211KYSB20150034);國家自然科學基金國際合作項目(61661136004);國家重點研發(fā)計劃項目(2016YFD0300702)
黃林生,博士,副教授,研究方向為農業(yè)遙感技術與應用。合肥安徽大學安徽省農業(yè)生態(tài)大數據工程實驗室,230601。
Email:linsheng0808@163.com
※通信作者:黃文江,博士,研究員,博士生導師。研究方向為植被定量遙感。北京 中國科學院遙感與數字地球研究所,100094。
Email:huangwj@radi.ac.cn