呂京國
(1. 北京建筑大學 測繪與城市空間信息學院,北京 100044;2. 現(xiàn)代城市測繪國家測繪地理信息局重點實驗室,北京 100044)
隨著遙感信息廣泛地應用于農業(yè)生產、災害評估與資源探測等領域,分類技術也成為遙感影像信息分析中的重要研究方向。面向高分辨率影像信息的分類技術層出不窮,不僅體現(xiàn)在以最小距離分類為代表的監(jiān)督分類技術,以ISODATA分類法為代表的非監(jiān)督分類技術,還包括逐漸成熟的神經網絡技術,也在遙感領域中得到全面應用。
遙感影像分類本身作為一種非線性問題的求解,滿足其解的方法在人工智能領域得到了驗證。神經網絡作為人工智能領域的一種從低維空間到高維空間映射的方法,它以一定的數學模型描述生物神經網絡的結構,以一定的算法模擬生物的行為,解決了傳統(tǒng)算法所面臨的智能信息處理問題。BP、RBF和Hopfield等神經網絡應用于遙感影像分類中,體現(xiàn)了神經網絡分布式存儲、并行處理和自學習與自組織等功能。
針對特定的遙感影像,不同類型的神經網絡分類器精度不同,而且同一個神經網絡分類器對不同類別的分類精度也不同。一些神經網絡分類器對一部分類別的分類精度高,而另一些神經網絡分類器只對另一部分類別的分類精度高,從而不同的神經網絡分類器之間可能有一定的互補性。因此,利用這種特性集成的神經網絡便有可能提高遙感影像的分類精度。本文分別研究了BP、RBF和Hopfield神經網絡的特性,構造異構網絡參與影像信息的分類,并以生成個體網絡的Bagging和Boosting算法作為集成方式,投票來決定最終的分類結果。
為了提供分類所需要的影像信息類型,影像分析以特征提取與特征選擇作為基礎。影像的灰度值代表地表信息的輻射值,高分辨率影像反映了更加精細的地表信息。應用于地物分類的影像含有不同類型的地物,需要選擇一定的特征代表不同類型的地物,并以一定的方法將特征所對應的空間劃分為不同的子空間,以使影像中代表各類地物的像元歸為相對應的子空間。
針對高分辨率影像結構信息豐富的特點,進行遙感影像分類時,既要考慮影像的灰度信息,也要顧及影像的結構信息,應選擇不同的特征反映以上要求。目前,常用的特征包含均值、方差、能量、對比度、熵、相關性和均質度等[1]。采用光譜信息與結構信息等多種特征相結合的方法,可以充分地利用影像灰度分布的信息,改善影像分類的效果。
遙感影像分類作為人工智能領域中模式識別的一種應用方向,其問題的解決需要利用以人類思維方式為基礎的信息處理技術。而作為具有大規(guī)模并行處理、容錯性自組織和自適應能力等特點的人工神經網絡,已成為解決遙感影像分類問題的有力工具。
神經網絡作為一種并行處理連接網絡,以多個互聯(lián)的神經元為基本處理單元,構建了具備信息存儲與信息計算能力的數學模型,抽象地模擬人腦智能行為[2]。目前,應用于遙感影像分類的神經網絡模型有BP網絡、RBF網絡和SOM自組織特征映射模型。BP網絡是一種多層前向型神經網絡,采用最小均方差的學習方式,其神經元的傳遞是S型函數,輸出量為0~1的連續(xù)量,權值的調整采用反向傳播算法,它可以實現(xiàn)從輸入到輸出的任意非線性映射[3]。RBF網絡也是一種三層前向型網絡,采用多種學習方法,如最小正交二乘學習算法和K均值學習算法等,其神經元的傳遞為高斯函數,確定中心和寬度后,其輸出權值可經解線性方程組得出,它可以實現(xiàn)學習速度的加快,以及可以避免局部極小值。Hopfield是一種由非線性元件構成的全連接單層反饋系統(tǒng),輸入層接收數據,網絡產生不斷的變化,輸出反饋到輸入從而產生新的輸出,達到一個能收斂的穩(wěn)定網絡[4]。以上3種網絡的神經元模型分別如圖1(a)—圖1(c)所示。
圖1 3種神經網絡的神經元模型
為了使不同的神經網絡應用于遙感影像的分類,以達到提高分類精度的目的,因此考慮采用神經網絡集成的方法。這種具有誤差互不相關的神經網絡集成方法,一方面可以提高分類精度,另一方面也具有較強的泛化能力[5]。
面對遙感影像分類問題,將訓練樣本操作的整個問題域劃分為子問題,每一個子問題采用Bagging或Boosting算法技術的集成實現(xiàn)。針對不同分類器所求解子問題域的輸出,則采用投票或決策融合的方式集成求解[6]。
在神經網絡集成中,當確定了構成集成的個體神經網絡結構和輸出合成的方法后,便需要應用一定的個體網絡構建方法訓練多個神經網絡。Bagging和Boosting算法為個體網絡生成中最重要的技術[7],Bagging算法思想是對訓練集采用獨立、隨機和有放回地抽取訓練樣本,為每一個基分類器都構造出一個與訓練集同樣大小但內容不同的訓練集,以訓練出不同的基分類器,從而得到一個性能改進的組合分類器。Boosting算法思想是學習一系列分類器,每一個訓練樣本被賦予一個權值,每學習完一個分類器,就增加被分類器錯誤分類的訓練樣本的權重,當所有的分類器學習完并且達到迭代次數,便可綜合得出一系列分類器。
本文采用江蘇常州市地區(qū)的航空高分辨率影像,經過大氣校正處理,研究區(qū)域選取500像素×500像素大小,試驗數據為紅綠藍3個波段,并提取灰度特征與紋理特征作為分類特征空間,通過目視判讀將影像中的地表類型分為水體、農地、林地與建筑物。
分類的精度提高,受各分類器分類誤差不相關性影響較大。不同的波段對分類結果的影響不同,不同的特征選擇也影響分類的效果,它們同時制約著分類器分類的誤差相關性。試驗中所采用的特征為紅綠藍3個波段,以及任選波段的均值、方差、能量、對比度、熵、相關性和均質度。分類精度評價指標包含總體精度、用戶精度、生產者精度、Kappa系數。原始圖像區(qū)域如圖2所示。
圖2 原始圖像區(qū)域
(1)單分類器試驗
面向多個神經網絡分類器,分別選取一定數量的訓練樣本與測試樣本進行影像分類,利用精度評價指標分析不同特征選擇下每一個分類器對不同類別的分類精度,為集成分類器的精度評價提供參考。
為了驗證不同類型特征下不同分類器對不同分類類別的影響,試驗分為兩種情況,第一種情況采用3個波段及任選波段的均值與方差,分別進行BP、RBF和Hopfield分類器分類的試驗(如圖3所示);第二種情況采用3個波段及任選波段的均值、方差、能量、對比度、熵、相關性和均質度,也分別進行與第一種情況相似的分類試驗(如圖4所示),表1為單分類器分類結果精度評價。
圖3 第一種情況單分類器分類結果(5個特征)
從分類結果圖和分類結果精度評價表可以看出,第二種情況的總體分類精度稍微高于第一種情況的總體分類精度,表明增加特征能更加合理地表達圖像類別信息。每一種情況內部不同分類器的總體分類精度差別不大,說明不同的神經網絡分類器在特征相同的情況下,對于總體分類精度的影響并不顯著。針對同一種分類器,一種試驗情況內不同類別的分類精度存在較大差別,體現(xiàn)了不同的地物類別所受分類器的影響顯著。
(2) 集成的分類器試驗
單分類器分類表明分類特征影響同類分類器分類的精度,不同的分類器精度也略有差別??梢詮奶卣髋c分類器的選擇角度,對于特征的獨立性與分類器的差異性特點,以集成的方式去構建分類器來提高分類的精度。試驗數據選擇單分類器試驗所給定的訓練樣本,采用Bagging和Boosting算法構造不同的訓練特征集,進一步構造參與分類的特征空間,并選擇BP、RBF和Hopfield的神經網絡參與個體網絡的生成,對于網絡輸出以投票的方式決定最后分類的結果。神經網絡集成采用如圖5所示的集成方式。試驗結果如圖6所示,精度評價如表2所示。
圖4 第二種情況單分類器分類結果(9個特征)
表1 單分類器分類結果精度評價表 (a)兩種試驗情況下,不同分類器下不同類別的生產者和用戶精度 (%)
(b)兩種試驗情況下,不同分類器的總體分類精度評價
圖5 神經網絡集成示意圖
圖6 神經網絡集成分類結果圖
表2 神經網絡集成分類結果精度評價表 (%)
根據試驗結果,并將集成的分類結果與單分類器分類結果作對比,可以看出神經網絡集成的分類器總體分類精度高于單個分類器的分類精度。神經網絡集成中采用Hopfield算法的分類精度顯著提高了整體分類精度。采用Boosting算法集成的分類器分類精度優(yōu)于Bagging算法集成的分類器分類精度。
面向高分辨率遙感影像分類的應用研究,神經網絡集成建模分析主要以數據的預處理、網絡模型的構建等方面為基本內容。
為了消除不同量綱網絡輸入對分類精度的影響,可采用比例壓縮法對網絡輸入的特征空間進行歸一化處理,并對網絡訓練后輸出的數據,進行反方向的處理。
BP和RBF網絡隱含層神經元的數目,采用直方圖分析法確定,輸入層神經元的數目為9,輸出神經元的數目即為所要分類的數目4。BP網絡的訓練次數人工設為500,訓練目標為0.001,隱含層函數采用S型正切函數,輸出層采用Sigomoid函數。RBF網絡的訓練目標為0.001,其寬度采用固定法確定。Hopfield網絡的訓練次數人工設為200,訓練目標為0.001,輸入層的神經元數目為9,輸出層神經元數目為10×4。Bagging算法和Boosting算法分別按照其流程進行以上3個分類器的集成,所集成的神經分類器特點為復雜度高。
本文將神經網絡集成技術應用于高分辨率影像信息分析與建模,以航空遙感影像作為研究對象,分別進行了神經網絡單分類器分類試驗、神經網絡集成的分類器分類試驗,并比較了神經網絡單分類器分類精度與神經網絡集成的分類精度。通過研究可以發(fā)現(xiàn),針對神經網絡單分類器應該選擇更全面地表達影像信息的特征集合,以提高遙感影像的分類精度,進一步研究表明神經網絡集成分類器的精度優(yōu)于神經網絡單分類器。
研究結果表明,選取具有代表性樣本的前提下,選擇多個神經網絡分類器,并采用Bagging算法和Boosting算法應用于高分辨率影像分類,就可以在一定程度上提高影像分類的精度,對于實用化高分辨率影像分類具有較強的推廣性。
參考文獻:
[1] 賈永紅. 數字圖像處理[M].武漢:武漢大學出版社, 2003.
[2] 鐘珞,饒文碧,鄒承明. 人工神經網絡及其融合應用技術[M].北京:科學出版社, 2007.
[3] 陳紹杰,逄云鋒. Boosting和Bagging算法的高分辨率遙感影像分類探討[J]. 測繪科學,2010,35(5):169-172.
[4] 董廣軍,張杰,徐銘杰,等. 基于Hopfield 神經網絡模型的遙感影像分類算法[J]. 測繪學院學報, 2003,20(4):267-270.
[5] 傅強. 選擇性神經網絡集成算法研究[D].杭州:浙江大學, 2007.
[6] 柏延臣,王勁峰. 結合多分類器的遙感數據專題分類方法研究[J]. 遙感學報, 2005,9(5):555-563.
[7] 史忠植. 神經網絡[M].北京:高等教育出版社, 2009.