謝凱
((長江航道測量中心,湖北 武漢 430010)
在自然界中每個地物都是以光譜特征作為基本表現(xiàn)形式,且均有自己獨特的波譜反射和輻射特性,可利用其地物波譜的差異對目標地物進行遙感識別[1-4].因此,精確地對遙感圖像進行分類和專題信息提取,必須對各類地物波譜特性及其變化規(guī)律有較全面深入的認識.不同地物的反射率隨波長的變化不相同,即使是同種地物,在內(nèi)部結(jié)構(gòu)和外部條件存在差異的情況下,其波譜曲線的形態(tài)表現(xiàn)也不相同,因此,波譜形態(tài)差異是地物遙感鑒別的重要依據(jù)之一.然而,從現(xiàn)有的研究結(jié)果可以看出,波譜形態(tài)差異作為地物遙感鑒別的重要依據(jù)未被充分用于遙感圖像分類中,較多的研究者采用對單時相的多光譜或高光譜影像和多時次的時序影像進行地物的若干特征值提取等“降維”方式進行圖像處理.然而,在“降維”處理中,地物波譜變化的形態(tài)信息會因“降維”處理丟失較多,所得數(shù)據(jù)信息無法使用.本研究中從曲線形態(tài)學(xué)[5]角度出發(fā),在Matlab程序設(shè)計平臺下,設(shè)計一種基于波譜形態(tài)差異的遙感影像分類方法[6-8],其研究成果可直接應(yīng)用于高光譜遙感圖像分類[6-8],同時有助于有明顯季節(jié)性變化特征的植被遙感識別和土地覆被分類.
為了從不同尺度定量描述地物波譜曲線的形態(tài)特征,本文中選擇定義波形形態(tài)參數(shù)且將其編碼化來實現(xiàn).本文中用具有明確數(shù)學(xué)定義的基本語素定義波形形態(tài)參數(shù),基本語素基于曲線的拐點,也稱為曲線語素.曲線語素是一種表達信息的常用符號,但所能表達的信息十分有限,為使其有用信息最大限度地表達,需對語素向量[9]進行二次定義,即對曲線進行數(shù)值化描述[5],可用若干字符所組成的字符串對曲線進行表達.實際應(yīng)用中,曲線數(shù)據(jù)信息常常受到噪聲干擾,導(dǎo)致數(shù)據(jù)信息的可靠性較低,為使曲線的句法足夠靈活、豐富且具有抽象性,本文中定義了曲線語素的通配符,以便更靈活地描述曲線[10]的真實形態(tài).
從語素向量的說明可知,可用曲線抽取的向量序列組合起來的二維數(shù)據(jù)表對曲線形態(tài)進行描述[9].因應(yīng)用領(lǐng)域不同,對選用的語素向量也有所不同.通過二維數(shù)據(jù)表對曲線形態(tài)的描述,最終實現(xiàn)曲線形態(tài)特征的數(shù)值化描述[10].從一個特定的地物類型的波譜曲線看出,同類地物反射率的變化和差異是由于時間不同或地物物質(zhì)含量的不同所導(dǎo)致的,但其值是在一定標準曲線的范圍內(nèi)小浮動變化,不論變化幅度的大小,同種地物曲線的形態(tài)始終穩(wěn)定在一定范圍內(nèi)變化.不同地物的波譜曲線形態(tài)存在或大或小的差異,在對波譜曲線形態(tài)描述轉(zhuǎn)化為相應(yīng)的二維表的同時,也設(shè)計相應(yīng)地物的識別模板.為識別所選遙感影像地物類別[6-8],通過設(shè)計的模板對經(jīng)過處理的遙感影像進行識別,若進行一次識別無法達到理想的識別效果,即對影像上的灌木叢、植被、水體等類別不能較好的識別出來,則進行二次或多次模板設(shè)計與識別,直至識別效果理想.識別模板中的語素數(shù)字化地表達了地物波譜曲線的形態(tài)變化,而形態(tài)變化的幅度則通過語素的屬性定義表達.
地物反射率的不同,是因地物波譜曲線的形態(tài)隨波長的變化導(dǎo)致較大差異所致.通常,不同地物的波譜曲線形態(tài)不同,但在特殊情況下同種地物的波譜曲線形態(tài)也會在一定范圍內(nèi)波動變化,即內(nèi)部和外部條件不同時,則出現(xiàn)波譜曲線形態(tài)的波動變化.地物波譜特性是地物遙感[11]技術(shù)應(yīng)用中的物理基礎(chǔ),且是利用地物波譜特性研制遙感器和進行遙感圖像處理與分析的重要依據(jù),同時也是遙感定量分析的基礎(chǔ).所以,在遙感專題信息提取及應(yīng)用分析[11]研究中,地物波譜特征的研究是十分重要的組成部分.
以往的分類過程中由于地物波譜信息的不足導(dǎo)致諸多不確定性,造成分類結(jié)果的可靠性較低.而今可從高光譜影像上找尋地物信息較為豐富的像元來提取連續(xù)光譜曲線[12],不僅可以進行光譜波形形態(tài)分析,還能實現(xiàn)依據(jù)光譜曲線形態(tài)進行的地物識別.
2.1 基于波譜形態(tài)差異的遙感影像分類研究意義遙感圖像分類是依據(jù)遙感圖像的光譜、紋理、形狀等特征將圖像劃分為互不相交的地物類型區(qū)域的過程.地物的波譜特征研究歷來是現(xiàn)代遙感技術(shù)研究的重要組成部分,與遙感技術(shù)的發(fā)展密不可分.它既是遙感器波段選擇和設(shè)計的依據(jù),又是遙感數(shù)據(jù)分析解譯的基礎(chǔ),是建立地面數(shù)據(jù)和遙感數(shù)據(jù)關(guān)系的橋梁.所以,波譜形態(tài)差異的遙感圖像分類研究對遙感圖像分類精度的提高及有著明顯季節(jié)性變化特征的植被遙感識別和土地覆被分類有著重要意義.
2.2 基于波譜形態(tài)差異的遙感影像分類原理同一物體的波譜曲線在不同情況下可以反映不同波段的不同光譜響應(yīng).地物類型的不同,導(dǎo)致地物對不同波長的電磁波的反射因物質(zhì)的組成結(jié)構(gòu)的差異而具有不同的選擇性反射,形成了不同光譜反射率曲線,從而具有相異的波譜形態(tài);通常,同類地物的光譜反射率差異是由于同類地物存在的物質(zhì)含量不同而有所不同,且隨時間變化而變化,但變化值在一個特定范圍內(nèi)小幅度變化.從變化情況可以看出,同一類地物的反射率雖有小幅度變化,但地物曲線的形態(tài)始終保持穩(wěn)定.因此遙感圖像分類研究[11]中可以把地物波譜曲線形態(tài)的相似性作為圖像分類的重要判別依據(jù)之一.
2.3 基帶通配符的波譜形態(tài)匹配本文中主要采用一種允許錯位匹配、多層次的匹配算法,將識別模板與目標曲線二維表進行一一匹配.算法的步驟如下:首先,對模板中非通配符的語素的編號進行提取.其次,按錯位匹配的思想,對目標曲線中的語素逐一考察,并用上一步中所得的語素集對語素進行過濾,得到初步匹配曲線.然后,在不考慮通配符的情況下,把初步匹配曲線按照語素的屬性約束條件進一步過濾.最后,將上一步得到的每一個匹配曲線還原到原目標曲線中,并將錯位跳過的部分計入通配符,形成具有語素和通配符的完整字符串組合與識別模板進行最終匹配,匹配的像元則屬于識別模板的對應(yīng)類別,達到地物識別和分類的目的,此方法是基于地物波譜曲線形態(tài)差異的遙感圖像分類方法.
3.1 數(shù)據(jù)源的選取本文中的分類研究選取的遙感影像是覆蓋美國Colorado州Boulder市的AVIRIS(airborne visible infrared imaging spectrometer,機載可見光/紅外成像光譜儀)航空高光譜遙感影像.所選影像的研究區(qū)域氣候溫和,具有多石的地貌特征,地層多為紅色砂巖.研究區(qū)域內(nèi)地表覆蓋物主要包括植被、水體、濕地以及各種人工建筑物等.數(shù)據(jù)成像時間為2011年8月7日,獲取飛機飛行高度為21 km,空間分辨率為10m,共224個波段.所選影像良好,無云覆蓋等噪聲,圖像較為清晰,如圖1所示.
3.2 數(shù)據(jù)源的預(yù)處理在進行圖像分類之前需對所用遙感影像做幾何精校正處理.本文中對遙感影像進行幾何精校正采用的是2次多項式模型,且精度控制在一個像元以內(nèi).遙感影像的灰度值是經(jīng)過量化和糾正過的以編碼化的數(shù)字影像,然后將灰度值轉(zhuǎn)化為大氣層頂反射率以便精確表示地物反射、輻射特性,最后再進行大氣校正以得到地表反射率影像.本文中用ENVI遙感軟件對數(shù)據(jù)影像進行轉(zhuǎn)換,成功生成地表反射率影像.
圖1 研究區(qū)影像圖
為提高本研究方法的實驗效率,在不影響實驗結(jié)果的前提下從影像中裁剪出一片地類較復(fù)雜較全面且質(zhì)量較好無云的區(qū)域進行試驗.裁剪后的試驗數(shù)據(jù)為197*230像素.AVIRIS數(shù)據(jù)具有224個波段,去除水吸收和低信噪比的波段后,保留其中166個波段.本文中提出的分類方法因受軟件和硬件限制的關(guān)系,需對166個波段進行相關(guān)性分析,用相關(guān)系數(shù)矩陣對經(jīng)過上述處理的AVIRIS影像以原波段順序按“同一組內(nèi)任意兩個波段之間的相關(guān)系數(shù)在0.99以上”的原則進行分組,然后對每一組進行主成分分析,取各組的第一主分量疊加成由20個波段組成的新影像,新影像用的20個波段包含了影像的絕大部分信息,且大大降低了相關(guān)信息之間的冗余,能夠滿足本研究的試驗需求.原始影像和20個波段的新影像的波段對應(yīng)關(guān)系如表1所示.同時,對影像進行上述預(yù)處理操作后,將得到的新影像的反射率數(shù)據(jù)進行拉伸后轉(zhuǎn)換成TIF格式保存.
表1 新組合的影像和原始影像之間的波段對應(yīng)關(guān)系
4.1 基于波譜形態(tài)差異的AVIRIS影像分類實現(xiàn)結(jié)合本試驗的具體實際情況及需要實現(xiàn)的研究結(jié)果,設(shè)計如下幾個主要功能模塊:圖像輸入模塊、波段選擇模塊、讀取識別模板、分類.
1)圖像輸入模塊.主要實現(xiàn)語句如下:
2)波段選擇模塊.遙感圖像一般是多波段圖像,不同類型的圖像波段數(shù)目及特點不同.利用該模塊可以對特定的遙感影像設(shè)置最佳顯示波段.這里通過彈出式菜單Pop-up Menu對象實現(xiàn)其相應(yīng)功能.
3)讀取識別模板.用來實現(xiàn)對各類地物模板的讀取,根據(jù)選擇路徑對話框選擇各類設(shè)計模板.
4)分類.為達到識別地物與分類的目的,用該模塊實現(xiàn)前述的地物波譜曲線形態(tài)的參數(shù)化描述以及曲線表達與識別模板之間的匹配算法.
基于前述的曲線形態(tài)參數(shù)化方法,地物波譜曲線描述算法的基本思想如下:首先讀取遙感影像,再把影像中每個像元的相鄰兩個波段進行比較,若前一個波段值小于后一個波段值,則賦予編碼0;若前一個波段值大于后一個波段值,則賦予編碼1;否則賦予編碼2,則得到一個由編碼0、1、2組成的標識數(shù)組.把所得標識數(shù)組中多余的相鄰重復(fù)元素進行剔除,使其相鄰的重復(fù)元素只保留一個標識編碼.把擴展語素3和4插入編碼0和1、1和0之間,分別表示峰值點和谷值點.至此使每個元素都有相應(yīng)的語素編碼,然后根據(jù)前述的定義把屬性特征賦予相應(yīng)的每個語素,如起點位置、終點位置、語素平均值、第幾個峰值(谷值)等,以得到對應(yīng)的語素向量,從而實現(xiàn)對每個像元波譜曲線形態(tài)的參數(shù)化表達.
匹配算法的基本思想如下:采用允許錯位匹配、多層次的匹配算法.步驟如下:第一步,對模板中的語素(不包括通配符)編號進行提取.第二步,在允許錯位匹配的思想下,對目標曲線中的語素依次進行考察并按上一步得出的語素集進行過濾,得到初步匹配曲線.第三步,在不考慮通配符的情況下,以語素的屬性作為依據(jù),對初步匹配的曲線進行二次過濾.第四步,將上一步得到的每一個匹配曲線還原到原目標曲線中,并將錯位跳過的部分計入通配符,形成完整的字符串組合(包括語素和通配符)與模板進行最終的匹配.匹配算法中最為關(guān)鍵的是第二步,由于錯位匹配的思想,目標曲線中可能會存在多種情況和模板中去除通配符的的語素編號匹配,需要對每一種情況對應(yīng)的匹配位置索引分別記錄.
識別部分在程序內(nèi)部通過執(zhí)行相應(yīng)的代碼實現(xiàn),以下是地物波譜形態(tài)參數(shù)化的圖像分類實現(xiàn)運行界面(圖2).
圖2 基于地物波譜形態(tài)參數(shù)化的圖像分類實現(xiàn)運行界面
圖3 SVM方法分類實現(xiàn)運行界面
4.2 基于SVM方法的分類實現(xiàn)在本研究中,進行對比的SVM分類方法[13-15]也在Matlab平臺中編程運行實現(xiàn)(圖3).研究中需先進行原始影像中感興趣區(qū)域的選擇[16],選擇的地物類型以不同顏色的矩形框進行區(qū)分.提取感興區(qū)域中像元曲線的參數(shù)化表達二維表,以此為特征進行分類,其分類實現(xiàn)如圖3所示.
圖4 隨機點生成圖
4.3 兩種分類方法分類精度對比分析
4.3.1 基于地物波譜形態(tài)參數(shù)化的圖像分類實現(xiàn)精度評價 本研究中所采用的精度評價方法是隨機采樣法,首先在所選取實驗的遙感影像上隨機生成300的評價樣點(圖4),然后使樣點與美國NLCD2006(national land cover database 2006)數(shù)據(jù)和 Google earth高清影像相結(jié)合對上述分類結(jié)果進行精度評價,建立基于地物波譜形態(tài)差異的遙感影像分類方法的精度評價誤差矩陣(表2).根據(jù)表2的統(tǒng)計結(jié)果,總體精度為83.67%,Kappa系數(shù)為0.788 8,精度較高.
表2 基于地物波譜形態(tài)參數(shù)化的遙感圖像分類結(jié)果混淆矩陣
4.3.2 基于SVM分類方法的分類實現(xiàn)精度評價 為了對兩種分類方法進行客觀的對比分析,同樣應(yīng)用前述隨機生成的300個評價樣點,對SVM方法的分類結(jié)果進行精度評價并做混淆矩陣(表3).根據(jù)表3,SVM方法分類總體精度為72.33%,Kappa系數(shù)達到0.660 1,精度較高.
表3 基于SVM方法的遙感圖像分類結(jié)果混淆矩陣
4.3.3 兩種分類方法分類精度對比分析 對比以上對兩種分類方法的精度評價混淆矩陣可知:
1)本文中提出的基于地物波譜形態(tài)參數(shù)化的遙感影像分類方法取得了不錯的分類效果,其分類總體精度達83.67%,高于SVM分類方法的總體精度72.33%;Kappa系數(shù)0.788 8,高于SVM分類方法的Kappa系數(shù)0.660 1,與SVM分類方法相比本文中提出的分類方法更為理想.
2)從地物波譜形態(tài)參數(shù)化的分類方法評價結(jié)果中看出,除灌木叢(Shrub)類別外,其他地類的精度均高于SVM分類方法.在SVM分類方法中,由于其他類別的地物像元被錯分為灌木叢,導(dǎo)致分類范圍大于實際類別范圍,使得灌木叢這一類別在SVM分類方法中制圖精度偏低.此原因也導(dǎo)致了SVM分類方法中水體(Water)類別的制圖精度很低.
通過本文中的相關(guān)研究可以看出,波譜形態(tài)能夠較好地表達非同類地物之間的差異性,可以作為遙感影像分類的依據(jù).依據(jù)遙感資料所表達的地物波譜曲線形態(tài)(波形),按照一定的規(guī)則或算法,可以對土地覆被類型做出“量化”判別.提出的基于地物波譜形態(tài)差異的遙感影像分類新方法,方法簡潔明了,易于理解,分類效果較好.從應(yīng)用該方法對裁剪后的AVIRIS影像所覆蓋的美國Colorado州Boulder市的土地覆被分類結(jié)果來看,其總體分類精度和Kappa系數(shù)都高于SVM分類方法.
本文中各種類別地物的識別模板以人工方式選擇大量樣本經(jīng)過分析和反復(fù)總結(jié)得到,需要花費一定時間.在今后的研究工作中,將進一步實現(xiàn)計算機自動提取識別模板功能,縮短人工操作所需的時間.未來的研究方向?qū)⒖赡芘c人工智能的一些研究熱點結(jié)合起來,實現(xiàn)自動化的分類系統(tǒng).
[1]梅安新,彭望琭,秦其明,等.遙感導(dǎo)論[M].北京:高等教育出版社,2001.
[2]王麗.基于Landsat_TM的地物光譜分析及沙化土地信息提取[D].開封:河南大學(xué),2005.
[3]喻小倩.基于最大似然分類的寧夏紅寺堡灌區(qū)的景觀變化[D].重慶:西南大學(xué),2010.
[4]朱述龍,朱寶山,王紅衛(wèi).遙感圖像處理與應(yīng)用[M].北京:科學(xué)出版社,2006.
[5]張桂梅,任偉,徐芬.基于特征點和最小面積的曲線描述和匹配[J].計算機應(yīng)用,2009,29(4):1159-1164.
[6]汪權(quán)方,李家永.鄱陽湖流域季節(jié)性綠色覆被(作物)的NDVI指數(shù)變化特征分析[J].測繪科學(xué),2009,34(3):22-24.
[7]汪權(quán)方,李家永.基于時序NDVI數(shù)據(jù)的中國紅壤丘陵區(qū)土地覆被分類研究[J].農(nóng)業(yè)工程學(xué)報,2005,21(2):72-77.
[8]汪權(quán)方,李家永,陳百明.基于地表覆蓋物光譜特征的土地覆被分類系統(tǒng)—以鄱陽湖流域為例[J].地理學(xué)報,2006,61(4):359-368.
[9]林培群,徐建閩.一種曲線形態(tài)的描述與識別方法及其應(yīng)用[J].華南理工大學(xué)學(xué)報:自然科學(xué)版,2009,37(2):77-81.
[10]崔明義,張新祥,蘇白云,等.用蟻群算法實現(xiàn)地理信息系統(tǒng)空間曲線的描述[J].計算機工程與應(yīng)用,2008,44(30):160-162.
[11]趙英時.遙感應(yīng)用分析原理與方法[M].北京:科學(xué)出版社,2003.
[12]李飛,周成虎,陳榮國.基于光譜曲線形態(tài)的高光譜影像檢索方法研究[J].光譜學(xué)與光譜分析,2008,28(11):2482-2486.
[13]李玲,王紅,劉慶生,等.基于紋理特征和支持向量機的ALOS圖像土地覆被分類[J].國土資源遙感,2011,91(4):59-63.
[14]朱海洲,賈銀山.基于支持向量機的遙感圖像分類研究[J].科學(xué)技術(shù)與工程,2010,10(15):3659-3663.
[15]張學(xué)工.關(guān)于統(tǒng)計學(xué)習理論與支持向量機[J].自動化學(xué)報,2000,26(1):32-42.
[16]王曉玲,杜培軍,譚琨.高光譜遙感影像SVM分類中訓(xùn)練樣本選擇的研究[J].測繪科學(xué),2011,36(3):127-129.