尹 成
(福建經(jīng)緯測(cè)繪信息有限公司, 福建 福州, 350001)
水體在地表廣泛分布,雨水季節(jié)時(shí)最易造成洪澇災(zāi)害。由于地形的復(fù)雜分布,僅依靠布設(shè)在河道中的水深監(jiān)測(cè)系統(tǒng)難以從宏觀角度監(jiān)測(cè)水體淹沒狀態(tài)。隨著遙感傳感器的快速發(fā)展,利用高時(shí)相、高分辨率遙感影像提取水體目標(biāo),可以實(shí)現(xiàn)對(duì)水資源、水環(huán)境、洪澇災(zāi)害的動(dòng)態(tài)監(jiān)測(cè),已在氣象、水利、農(nóng)業(yè)等部門得到廣泛應(yīng)用[1-2]。隨著影像的空間分辨率及光譜分辨率的逐步提高,地物可被更為精細(xì)的表達(dá),水體目標(biāo)的識(shí)別方法及可利用的識(shí)別特征在不斷發(fā)生變化。光譜特征一直被廣泛應(yīng)用于水體識(shí)別[3-4]。文獻(xiàn)[5]采用由美國國家海洋與大氣管理局(National Oceanic and Atmospheric Administration,NOAA)發(fā)射的NOAA衛(wèi)星攜帶的先進(jìn)的甚高分辨率輻射儀(advanced very high resolution radiometer,AVHRR)Level-1B(L1B)數(shù)據(jù),分析了水體的光譜特性,給出了基于光譜知識(shí)的水體自動(dòng)提取方法。文獻(xiàn)[6]提出了基于綠色波段和紅色波段的歸一化差異水體指數(shù)(normalized difference water index,NDWI)用于增強(qiáng)遙感影像中水體目標(biāo)與其他目標(biāo)的反差來識(shí)別水體。文獻(xiàn)[7-8]利用美國陸地衛(wèi)星5號(hào)衛(wèi)星專題制圖儀(thematic mapper,TM)傳感器所獲取的多波段掃描影像的中紅外波段提出了改進(jìn)歸一化差異水體指數(shù)改進(jìn)的歸一化差異水體指數(shù)(modified normalized difference water index,MNDWI)用于識(shí)別水體。在遙感影像目標(biāo)解譯時(shí),所有類別的水體常作為同一類目標(biāo)進(jìn)行提取而并沒有進(jìn)一步區(qū)分是否為河流與湖泊等類型。不同水體目標(biāo)的識(shí)別往往需要進(jìn)一步結(jié)合形狀等特征來實(shí)現(xiàn)。文獻(xiàn)[9]利用光譜特征先進(jìn)行影像分類提取水體,然后再在區(qū)域分割與邊界跟蹤基礎(chǔ)上提取水體形狀特征以識(shí)別出不同類型的水體。文獻(xiàn)[10]利用增強(qiáng)型專題制圖儀(enhanced thematic mapper,ETM+)傳感器獲取的遙感影像數(shù)據(jù),通過光譜特征和歸一化差值植被指數(shù)(normalized difference vegetation index,NDVI)實(shí)現(xiàn)水體信息的自動(dòng)提取,然后利用形狀指數(shù)、面積以及其他特征對(duì)水體進(jìn)行分類。
但是由于應(yīng)用需求的不同,水體目標(biāo)的進(jìn)一步類型劃分存在概念性差異,加上遙感數(shù)據(jù)的來源、獲取、傳遞以及處理的整個(gè)過程都存在引起差異性的原因,造成對(duì)水體類型進(jìn)一步判讀存在著模糊性和隨機(jī)性,即遙感數(shù)據(jù)的不確定性是必然的[11]。如何根據(jù)應(yīng)用所需的分類方案來選取最佳的分類特征,實(shí)現(xiàn)高效的水體分類,區(qū)分出河流與湖泊,具有重要的研究意義。云模型作為一種有效的知識(shí)挖掘和不確定性研究工具,可有效表達(dá)水體進(jìn)一步分類過程中存在的不確定性,實(shí)現(xiàn)從定量光譜信息到定性類別概念的不確定性轉(zhuǎn)換[12]。
本文針對(duì)已獲取的水體目標(biāo)的多種定量特征,利用云模型對(duì)不同的水體概念如河流與湖泊建立定性定量轉(zhuǎn)換模型,并通過樣本隸屬度測(cè)試選取最佳的水體識(shí)別特征。
1.1.1云的定義
設(shè)U是一個(gè)用精確數(shù)值表示的定量論域,C是U上的定性概念,若定量值x∈U,且x是定性概念C的一次隨機(jī)實(shí)現(xiàn),x對(duì)C的確定度μ(x)∈[0,1]是有穩(wěn)定傾向的隨機(jī)數(shù),μ:U→[0,1],?x∈U,x→μ(x),則x在論域U上的分布稱為云,每一個(gè)x稱為一個(gè)云滴[13]。
云模型的建立需獲知3個(gè)主要參數(shù):期望Ex、熵En、超熵He,用于共同描述某一特定概念,Ex是云在論域空間分布的期望,是最代表對(duì)應(yīng)概念的樣本;熵En是定性概念的不確定性度量,由概念的隨機(jī)性和模糊性共同決定,代表了定性概念的可度量粒度;超熵He是熵的不確定性度量,即熵的熵,由熵的隨機(jī)性和模糊性共同決定。
1.1.2正態(tài)云模型
若x滿足x~N(En,He2),且對(duì)C的確定度μ(x)滿足式(1)所示的隸屬度函數(shù)。
(1)
式中,Ex為期望;En為熵,則x在論域U上的分布稱為正態(tài)云模型。
正態(tài)分布和鐘形隸屬函數(shù)具有良好的通用性和普適性,沒有突變區(qū)域,在整個(gè)區(qū)間都具有連續(xù)性,符合一般情況下的隨機(jī)性和模糊度分布,在實(shí)際應(yīng)用中非常廣泛。因此,正態(tài)云是也具有良好普適性的云模型,能夠滿足一般情況下的定性研究,可作為遙感影像水體目標(biāo)識(shí)別的基本數(shù)學(xué)模型。
1.1.3云發(fā)生器
云發(fā)生器(cloud generator,CG)指云生產(chǎn)算法,可分為正向云發(fā)生器和逆向云發(fā)生器,原理圖如圖1所示。
正向正態(tài)云的生成算法:①輸入特征Ex、En、He和生成云滴的個(gè)數(shù)n;②計(jì)算得到一個(gè)以En為期望、He2為方差的正態(tài)隨機(jī)數(shù)En';③計(jì)算得到一個(gè)Ex為期望、En′2為方差的正態(tài)隨機(jī)數(shù)xi;④依據(jù)隸屬度函數(shù),計(jì)算每個(gè)xi對(duì)應(yīng)的隸屬度值μi;⑤完成足夠數(shù)量的云滴(xi,μi)。
(a)正向正態(tài)云發(fā)生器
(b)逆向正態(tài)云發(fā)生器
1.1.4X條件云發(fā)生器
已知云模型(Ex,En,He),對(duì)于特定的輸入x=x0條件,生成對(duì)應(yīng)的一個(gè)云滴(x0,μi),則稱為X條件云發(fā)生器。圖2所示為X條件云發(fā)生器原理。
具體做法:將橄欖油5 kg倒入鍋中,加入香菜段、蔥段各1 500 g,小火慢慢熬至香菜、蔥熟爛,油脂飄香即可。烹制海鮮菜起鍋時(shí)或上桌前,將自制蔥油淋入菜中,香氣四溢,海鮮更鮮。
圖2 X條件云發(fā)生器
具體實(shí)現(xiàn)算法為:已知云模型參數(shù),得到一個(gè)以En為期望、He2為方差的正態(tài)隨機(jī)數(shù)En';然后將x=x0代入式(1)計(jì)算此條件下隸屬度,(x0,μi)為云滴。
根據(jù)X條件云發(fā)生器,可以獲得特定特征值對(duì)于某一概念(云模型表示)的隸屬程度。由于En'是變化的,因此,對(duì)于相同的輸入x=x0和(Ex,En,He)也有可能獲得不同的μ,正體現(xiàn)了不同的人不同的時(shí)間對(duì)于同一數(shù)據(jù)隸屬于同一概念程度有一定的細(xì)微變化,從而使模糊性和隨機(jī)性得到較好的結(jié)合。
水體識(shí)別時(shí),選取最合適的特征組合將更有利于水體目標(biāo)的光譜、紋理、形狀特征。水體的光譜特征主要是水體的色調(diào)相對(duì)比較均勻,基本上呈現(xiàn)為藍(lán)色調(diào),有淺藍(lán)、深藍(lán)等,光譜波段的均值和標(biāo)準(zhǔn)差,能夠有效反映水體統(tǒng)計(jì)特性。水體目標(biāo)的形狀各不相同,一般來說,河流都是細(xì)長(zhǎng)形,湖泊都呈現(xiàn)為近圓形,實(shí)驗(yàn)發(fā)現(xiàn)不對(duì)稱性、緊湊度、密度、長(zhǎng)寬比,更能有效地顯示河流與湖泊的形狀差異。紋理特征是圖像細(xì)部結(jié)構(gòu)按照一定的頻率重復(fù)出現(xiàn)展現(xiàn)的特征。經(jīng)過試驗(yàn)比較,主要選取出7個(gè)波段的基于灰度共生矩陣的對(duì)比度、相關(guān)性、角二階矩,對(duì)河流與湖泊的區(qū)分力較強(qiáng)。經(jīng)過初步篩選,提取39種光譜、形狀、紋理特征,從中選取最佳特征組合。
1.2.1河流與湖泊概念云的生成
在遙感影像分類中,常將水體作為同一類目標(biāo)提取,很少進(jìn)行河流和湖泊的進(jìn)一步區(qū)分,而在水體遙感的應(yīng)用中,常存在這一需求。如何在已提取水體目標(biāo)基礎(chǔ)上,分析這兩類目標(biāo)的特征差異,進(jìn)行進(jìn)一步的區(qū)分,具有十分重要的研究意義。本文擬采用云模型通過分析河流與湖泊的光譜、紋理、形狀等特征,選取合適的特征組合,并采集大量已知類別的水體樣本,利用云模型獲取河流與湖泊的概念云。
根據(jù)采集的河流與湖泊的各類特征,依照逆向正態(tài)云模型的生成算法,完成云模型三參數(shù)期望Ex、熵En、超熵He的計(jì)算,可得到相應(yīng)特征下對(duì)應(yīng)河流與湖泊的云模型。以形狀特征密度為例,利用大量樣本特征分別針對(duì)河流與湖泊的云模型三參數(shù),再利用正向云模型計(jì)算x的隸屬度μ,生成該特征的河流與湖泊概念云。
1.2.2水體特征提取
利用易康eCognition軟件對(duì)在大量的TM影像中采集河流、湖泊樣本數(shù)據(jù)進(jìn)行特征選取實(shí)驗(yàn),統(tǒng)計(jì)各個(gè)特征的所有樣本數(shù)據(jù)對(duì)應(yīng)于河流或湖泊模型的隸屬度判定正確率,結(jié)果如表1所示,ML1-ML7、SL1-SL7分別代表TM波段1-7的光譜特征均值和標(biāo)準(zhǔn)差,CL1-CL7、AL1-AL7、RL1-RL7代表TM1-7個(gè)波段紋理特征中的對(duì)比度、角二階矩、相關(guān)性,以及形狀特征中的不對(duì)稱性、緊湊度、密度和長(zhǎng)寬比??梢钥闯?4個(gè)形狀特征中有3個(gè)特征正確率達(dá)到80%以上,間接表明形狀是區(qū)分河流與湖泊的最本質(zhì)特征。
表1 河流與湖泊樣本特征舉例及基于云模型的隸屬度判定正確率
在大量TM影像上采集了745個(gè)河流與湖泊的樣本數(shù)據(jù),將其分為訓(xùn)練數(shù)據(jù)與檢驗(yàn)數(shù)據(jù)兩部分,用于實(shí)驗(yàn)分析。圖3分別為從樣本數(shù)據(jù)中選取的河流與湖泊樣本示意圖。采用基于面向?qū)ο笏枷?提取圖中2個(gè)河流與2個(gè)湖泊樣本的39個(gè)特征值如表2所示。結(jié)合圖表可以看出,河流與湖泊均作為水體,具有相近的光譜特征,但會(huì)隨著水深、含沙量、污染物等不同而存在差異。此外,河流與湖泊在形狀上具有明顯差異。本文采用基于云模型的特征選取方法,通過科學(xué)的方法對(duì)各種特征區(qū)分河流與湖泊的能力進(jìn)行了測(cè)試,基本證明形狀特征中的緊湊度、密度和長(zhǎng)寬比具有優(yōu)秀的區(qū)分能力。
(a)河流A
(b)河流B
(c)湖泊1
(d)湖泊2
表2 圖4中的河流與湖泊的樣本特征數(shù)據(jù)
為了驗(yàn)證本文提出的基于云模型選取水體識(shí)別特征的有效性,通過采用如表3所示的特征分組,分別結(jié)合基于支持向量機(jī)(SVM)分類算法[14]和BP神經(jīng)網(wǎng)絡(luò)算法[15],利用訓(xùn)練樣本數(shù)據(jù)進(jìn)行分類器的訓(xùn)練,利用檢驗(yàn)數(shù)據(jù)對(duì)該特征組合下的分類精度進(jìn)行對(duì)比分析,結(jié)果如表3所示。其中,特征組合A至F分別是光譜特征均值、光譜特征方差、紋理特征對(duì)比度、紋理特征角二階矩、紋理特征相關(guān)度、形狀特征7大類,對(duì)比可以看出,不論是利用何種分類方法,形狀特征均取得了最好的分類精度,其他特征組合的分類能力會(huì)隨分類器方法的不一樣而有所變化。特征組合G和H分別是所有的光譜特征和所有的紋理特征,可以看出,光譜特征和紋理特征區(qū)分河流與湖泊的能力差別不大,總體來說紋理特征略勝一籌。根據(jù)表1中正確率排名前3~6的特征構(gòu)造組合I、F、J、K,對(duì)比看出,利用正確率均達(dá)到80%以上的特征組合I進(jìn)行分類取得了所有特征組合中最高的分類精度,達(dá)到了99%以上。隨著其他正確率稍低的特征加入,分類精度有所下降??傮w分析得出,采用本文方法能夠有效地判斷候選特征的水體類型辨別能力,將有助于選取最佳的分類特征組合。密度、緊湊度、長(zhǎng)寬比是區(qū)分河流與湖泊的最佳特征組合。
表3 不同特征組合下的分類精度對(duì)比
將本文基于云模型選取特征和傳統(tǒng)不區(qū)分特征的方法,與SVM和BP神經(jīng)網(wǎng)絡(luò)分類法進(jìn)行結(jié)合,用于湖泊與河流分類,精度對(duì)比結(jié)果如表4所示。
表4 與其他方法對(duì)比的水體識(shí)別精度對(duì)比
可以看出,基于云模型的方法選取的密度、緊湊都、長(zhǎng)寬比是非常有效的特征,與分類器結(jié)合均能達(dá)到較高的分類水平。如果不對(duì)特征加以區(qū)分,直接與分類器結(jié)合,識(shí)別能力明顯偏弱。因此,基于云模型科學(xué)有效的選取合理有效的特征對(duì)提升水體的分類識(shí)別能力有非常重要的作用。
本文利用云模型理論定量分析各類不同的光譜、紋理、形狀特征區(qū)分河流與湖泊的能力,發(fā)現(xiàn)密度、緊湊度、長(zhǎng)寬比是河流與湖泊的區(qū)分的最有效特征組合,與傳統(tǒng)的特征分類法相比,基于云模型的特征選取方法提供了科學(xué)的特征選取方法,能更有效地指導(dǎo)合理的特征選取,有助于水體識(shí)別精度的提高。