李 飛,桑國慶,孫 盈,曹方晶
(1. 水發(fā)規(guī)劃設(shè)計有限公司,山東 濟南 250100; 2. 濟南大學(xué) 水利與環(huán)境學(xué)院,山東 濟南 250022;3. 山東省海河淮河小清河流域水利管理服務(wù)中心,山東 濟南 250014)
水資源在生物圈中發(fā)揮著至關(guān)重要的作用。高效提取水體信息在濕地保護、洪水監(jiān)測、蓄洪抗旱方面具有重要的意義和價值。水文和水體信息的常規(guī)獲取途徑主要是水文站點的監(jiān)測數(shù)據(jù)和野外測量。人工野外測量能夠獲得高精度的面積、流速、流量等信息,但高危險、長周期等特性限制了該方法的使用。為了彌補人工野外測量的缺點與不足,遙感手段更加適用于高時空分辨率的水資源信息獲取和實時監(jiān)測[1]。隨著國產(chǎn)高分一號(GF-1)遙感衛(wèi)星成功發(fā)射及正常運轉(zhuǎn),覆蓋范圍廣、獲取速度快及更新周期短等眾多優(yōu)點使其常被用來提取水體信息,學(xué)者們在采用國內(nèi)高分遙感影像進行水體信息提取的研究方面進行了深入的探討[2-3]。
國外開展水體遙感提取的研究大多數(shù)是在陸地衛(wèi)星(Landsat)、中分辨率成像光譜儀(MODIS)、法國地球觀測衛(wèi)星(SPOT)等中、高分辨率的衛(wèi)星影像的基礎(chǔ)上進行的,比我國的研究要早。伴隨著我國越來越重視遙感技術(shù)的發(fā)展,GF-1衛(wèi)星遙感越來越受到關(guān)注[4]。目前國內(nèi)外也有不少學(xué)者利用GF-1衛(wèi)星遙感影像波段信息提取水體數(shù)據(jù),針對如何提高遙感影像的水體信息提取精度開展了相關(guān)研究。黃帥等[5]在特克斯河研究中利用面向?qū)ο蠓椒ㄍ瓿闪藢λw信息的提取,提取精度比最大似然法的提高了4.01%。陳文倩等[6]提出了一種適用于特克斯河流域的決策樹法,提取水體信息的結(jié)果較為完整,可以有效地區(qū)分水體和積雪等不同環(huán)境。張德軍等[7]結(jié)合目視解譯和支持向量機(SVM)的方法在三峽庫區(qū)對水體實現(xiàn)了精細化提取,結(jié)果表明,4個試驗區(qū)的總體提取精度都達到90%以上。以上研究多集中在山區(qū)河流和水庫等區(qū)域,針對復(fù)雜水體信息提取的研究尚不多見,因此本文中以山東省微山縣為研究區(qū),以GF-1衛(wèi)星遙感影像為數(shù)據(jù)源,利用單波段閾值法、歸一化水體指數(shù)法與決策樹法提取復(fù)雜水體信息,為快速、準確地從遙感圖像提取水體信息,滿足應(yīng)急水情監(jiān)測及防災(zāi)的需要提供借鑒。
微山縣位于山東省西南部,地理位置為東經(jīng)116°39′—117°23′、北緯34°26′—35°7′,我國北方最大的淡水湖泊——微山湖位于研究區(qū)內(nèi)。該研究區(qū)內(nèi)地物類型復(fù)雜多樣,主要有開闊湖區(qū)、河流水渠、農(nóng)田、濕地植被、養(yǎng)殖區(qū)、建筑區(qū)等,其中水體面積占大多數(shù),類型多樣,包括微山湖開闊水體、入湖河流水渠、湖岸和島嶼邊緣圍網(wǎng)養(yǎng)殖水面以及城市水體4大類水體。
1.2.1 數(shù)據(jù)源
本文中數(shù)據(jù)源為GF-1C全色多光譜相機(PMS)傳感器的兩景影像,全色波段空間分辨率為2 m,多光譜波段空間分辨率為8 m。兩景影像拍攝時間均為2019年7月1日,為1A級影像,軌道號為(662,97~98),太陽方位角為126.269 332°,太陽高度角為17.753 367°,覆蓋范圍為東經(jīng)116°24′—117°24′、北緯34°23′—35°21′,影像無云覆蓋。GF-1衛(wèi)星遙感影像包括藍光(波長為0.45~0.52 μm)、綠光(波長為0.52~0.59 μm)、紅光(波長為0.63~0.69 μm)、近紅外(波長為0.77~0.89 μm)4個波段。
1.2.2 數(shù)據(jù)預(yù)處理
GF-1衛(wèi)星1A級遙感數(shù)據(jù)屬于相對輻射校正數(shù)據(jù),為了確保后續(xù)水體信息提取的精度,在遙感圖像處理平臺ENVI 5.3.1中對影像進行預(yù)處理操作,主要包括輻射定標—大氣校正—正射校正—融合—鑲嵌—裁剪等流程。輻射定標是一種轉(zhuǎn)化關(guān)系,是根據(jù)元數(shù)據(jù)把圖像上的數(shù)值(digital number, DN)轉(zhuǎn)變成輻射亮度值的過程。對影像繼續(xù)進行大氣校正,目的是去除大氣中氣溶膠對影像的影響,提高影像質(zhì)量。為了消除影像因地形起伏而引起的偏移,正射校正利用從地理空間數(shù)據(jù)云(http://www.gscloud.cn/)下載的分辨率為30 m的數(shù)字高程數(shù)據(jù)(DEM)對影像進行地形變形的糾正??紤]到GF-1衛(wèi)星遙感影像全色波段與多光譜波段的分辨率成4倍關(guān)系,融合方法采取全色圖像銳化(Pan-sharpening)方法,該方法保真效果好,可將多光譜的色彩信息與全色波段的空間細節(jié)信息結(jié)合在一起。圖像鑲嵌是將上述兩景處理后的分辨率為2 m的遙感影像進行無縫拼接。
為了縮短軟件運行耗時,確保研究區(qū)水體的完整性,選取目標區(qū)的矢量數(shù)據(jù)裁剪出研究區(qū)的影像作為研究數(shù)據(jù),完成預(yù)處理后的研究區(qū)影像由藍、綠、紅、近紅外4個波段組成。圖1所示為由假彩色波段組合顯示的標準假彩色影像,圖中深藍色表示水體,紅色表示植被。
在可見光波段內(nèi)水的反射率一般較小,通常為4%~5%,且與波長呈負相關(guān)[8-9]。水體在藍、綠波段呈現(xiàn)高反射、低吸收的特點;但在近紅外波段呈現(xiàn)相反特征,因此遙感圖像中水體顏色呈現(xiàn)深色。由于水體在不同波譜上的呈現(xiàn)具有差異性,因此能更好地區(qū)分開水體與其他類型地物。
圖1 研究區(qū)預(yù)處理后標準假彩色影像
研究區(qū)含有水體、建筑區(qū)、濕地植被以及農(nóng)田等4大類典型地物,對研究區(qū)創(chuàng)建相應(yīng)的感興趣區(qū)域,繪制對應(yīng)的地物類別,得到研究區(qū)典型地物樣本,利用遙感圖像處理平臺ENVI中感興趣區(qū)域工具(ROI Tool)對感興趣區(qū)域進行n維可視化處理,得到4類典型地物在不同波段的反射率,見表1(其中反射率擴大10 000倍)。
表1 研究區(qū)典型地物在不同波段的反射率均值
利用GF-1衛(wèi)星遙感影像,分別采用單波段閾值法、歸一化水體指數(shù)法與決策樹法對研究區(qū)內(nèi)水體信息進行提取,并對這3種方法提取結(jié)果的精度進行比較。
2.2.1 單波段閾值法
根據(jù)研究區(qū)典型地物在GF-1衛(wèi)星遙感影像的4個波段中的光譜特征,可以區(qū)分水體與其他地物。水體在近紅外波段具有強吸收、弱反射的光譜特性,而濕地植被、建筑區(qū)和農(nóng)田則具有強反射的光譜特性,因此單波段閾值法選取近紅外波段進行水體提取,具體公式為
B4T,
(1)
式中:B4為近紅外波段像元值;T為水體提取的閾值。
式(1)表示在閾值T范圍內(nèi)的像元均為水體。經(jīng)過灰度直方圖分析,且多次試驗比對分析,確定閾值T為1 128時水體信息提取效果最佳。
2.2.2 歸一化水體指數(shù)法
目前水體指數(shù)法提取水體信息在水體研究中應(yīng)用最普遍,依據(jù)歸一化植被指數(shù)(normalized difference vegetation index, NDVI)的構(gòu)建原理,McFeeters[10]選取綠波段和近紅外波段提出了歸一化水體指數(shù)(normalized difference water index, NDWI),具體公式為
(2)
式中:Indw為歸一化水體指數(shù);B2為綠光波段像元值。
將NDWI運用到GF-1衛(wèi)星遙感影像中,能夠在很大程度上去除植被信息,強調(diào)水體信息,同時利用適當(dāng)?shù)拈撝祵⑺w與非水體進行區(qū)分。將預(yù)處理后研究區(qū)內(nèi)的影像進行NDWI運算,統(tǒng)計運算后影像的像元值,得到灰度直方圖。經(jīng)過大量試驗驗證,選擇NDWI灰度直方圖中2個波峰之間的平緩谷底作為經(jīng)驗閾值時水體信息提取的效果最好,即NDWI大于-0.007 6時水陸邊界分離結(jié)果最好,因此,選擇-0.007 6作為水體與其他地物的區(qū)分閾值。
2.2.3 決策樹法
決策樹(decision tree,DT)類似二叉樹,是由一個根節(jié)點、若干個內(nèi)部節(jié)點和葉節(jié)點組成的分類方法,主要使用與決策屬性相對應(yīng)的每個葉節(jié)點進行分類,最終決策則是從連續(xù)決策中得出的。該方法的分類思想實質(zhì)上是一種分類程序,在對每個葉節(jié)點進行測試的基礎(chǔ)上,將一個數(shù)據(jù)集遞歸地劃分為小分支,決策樹的構(gòu)建就是對一組訓(xùn)練數(shù)據(jù)的遞歸分割,通過對一個或多個特征值的測試,將一組訓(xùn)練數(shù)據(jù)分成分類特征相同的數(shù)據(jù)集[11-12]。水體提取實質(zhì)上屬于二元分類,而決策樹是解決二元分類問題的有效手段,知識決策樹模型特別適用于基于簡單特征的地物提取問題。
基于單波段閾值法和歸一化水體指數(shù)法2種方法在GF-1衛(wèi)星遙感影像中的應(yīng)用,分析其優(yōu)勢與不足,本文中采用近紅外波段閾值、NDVI、NDWI等多種方法構(gòu)建決策樹算法,對研究區(qū)水體進行提取。為了區(qū)分出暗色像元和亮色像元來大致提取水體和非水體,采用GF-1衛(wèi)星遙感影像近紅外波段像元的閾值確定水體與非水體的分割邊界,將二者閾值設(shè)為1 128,確定水體像元亮度范圍為[0,1 128),非水體像元亮度范圍為[1 128,8 000]??紤]到其他暗色地物可能混入水體像元中,例如某些水生植被、農(nóng)田用地及部分建筑用地等,為了將其與水體分離,依次利用NDVI和NDWI區(qū)分水體和濕地植被、農(nóng)田、建筑等背景。為了最大程度地抑制植被信息,突出水體特征,經(jīng)NDVI灰度直方圖反復(fù)試驗,發(fā)現(xiàn)閾值設(shè)定為-0.007 4時,效果最佳。
利用NDWI抑制農(nóng)田用地及建筑用地的信息,從而突出水體,根據(jù)NDWI灰度直方圖反復(fù)試驗,確定閾值為-0.007 6時提取效果最好。決策樹水體提取模型如圖2所示。
B4—紅外波段像元值;NDVI—歸一化植 被指數(shù);NDWI—歸一化水體指數(shù)。圖2 決策樹水體提取模型
根據(jù)以上3種方法提取的水體信息得到的圖像進行二值化處理,結(jié)果如圖3所示,其中白色表示水體,黑色表示非水體,以便區(qū)分水體與背景值。3種方法均采用灰度直方圖獲得閾值,結(jié)果如圖4所示。
(a)單波段閾值法(b)歸一化水體指數(shù)法(c)決策樹法圖3 不同方法提取的水體信息結(jié)果(白色為水體,黑色為非水體)
提取結(jié)果中通常會存在不同程度的碎片化,由于本文中采用3種不同方法進行水體信息的自動提取,因此不進行后續(xù)的人為處理,以確保提取結(jié)果的真實性。從圖3中可以看出,3種方法都可以較完整、準確地提取出微山湖開闊水體,但是在地物分布較為復(fù)雜的區(qū)域存在差異,主要表現(xiàn)是對陰影、建筑、養(yǎng)殖區(qū)的誤提,以及對養(yǎng)殖區(qū)、農(nóng)田、河流水渠、城市水體的漏提。為了得到將顏色較深的水體與其他地物進行區(qū)分的閾值,單波段閾值法需要大量反復(fù)試驗確定閾值,但在與水體光譜特征相近的陰影區(qū)、建筑區(qū)等區(qū)域存在較多的誤提現(xiàn)象。相比之下,NDWI法易于操作,但提取效果與真實水體存在差異,表現(xiàn)在建筑區(qū)水體、河流水渠、湖泊淺灘及養(yǎng)殖水域呈現(xiàn)不同程度的錯誤。決策樹法提取水體造成誤提和漏提現(xiàn)象不明顯,較完好地提取了開闊水域,同時兼顧了大、小河流以及養(yǎng)殖魚塘、蝦池處水體信息的完整性,但提取過程比前2種方法更繁雜,所需的時間也更長。
(a)單波段閾值法
(b)歸一化水體指數(shù)法
(c)決策樹法圖4 不同方法灰度直方圖的閾值結(jié)果
單波段閾值法、NDWI法及決策樹法提取結(jié)果的主要區(qū)別是在非水體(農(nóng)田、建筑區(qū)、陰影)和水體(河流水渠、湖區(qū)、養(yǎng)殖區(qū)、城市水體)處。水體及非水體的具體細節(jié)對比如表2所示,黃色框內(nèi)為不同地物的主要對比區(qū)域。
由表可知,3種方法在對農(nóng)田附近水體、養(yǎng)殖區(qū)水體、城市水體以及河流水渠處提取特征時都出現(xiàn)了漏提,其中NDWI法的漏提最為嚴重,相比之下,決策樹法的漏提和誤提現(xiàn)象相對較少,與實際水體的分布情況較為吻合,單波段閾值法的提取效果處于兩者之間。對于部分建筑區(qū),NDWI法存在嚴重的誤提現(xiàn)象,單波段閾值法和決策樹法提取的效果相似,僅出現(xiàn)少量的誤提區(qū)域。此外,3種方法在獲取細小河流、水渠類型的水體信息時通常出現(xiàn)“斷流”現(xiàn)象,其中單波段閾值法和決策樹法提取的信息相對連續(xù)和完整,而NDWI法提取效果不佳。單波段閾值法和NDWI法存在將陰影錯誤提取為水體的現(xiàn)象,而決策樹法提取時基本無誤。
基于研究區(qū)的衛(wèi)星遙感影像,將人工目視解譯出的水體信息作為真實參考值,驗證3種方法的提取結(jié)果的精度,并進行統(tǒng)計分析。
首先通過在預(yù)處理后的遙感影像上的人工目視判讀,解譯出水體信息;然后對人工判讀的結(jié)果進行二值化處理(水體為1,非水體為0);最后分別用3種不同提取方法得到的結(jié)果與人工解譯結(jié)果進行差值運算(被減數(shù)為自動化提取二值化影像像元,減數(shù)為對應(yīng)人工目視解譯的二值化影像像元)。經(jīng)過運算后統(tǒng)計3種方法提取水體的精度,用漏提率、誤提率和提取精度來定量對比不同方法的提取精度,其中-1表示未被提出的水體像元,該類像元數(shù)與總像元數(shù)的比值即為水體的漏提率;0表示地物類別被提取正確的像元,該類像元數(shù)與總像元數(shù)的比值即為水體的準確提取精度;1表示把其他類別地物像元錯誤提取為水體的像元,該類像元數(shù)與總像元數(shù)的比值即為水體的誤提率[13]。分別將3種方法提取的研究區(qū)水體結(jié)果進行差值運算,結(jié)果如表3所示。
由表中可以看出,NDWI法的水體漏提、誤提的比例偏高,原因主要是受研究區(qū)水體類型多樣性、分布復(fù)雜性、以及混合像元高占比等因素的影響。決策樹法水體漏提的比例最低,誤提率也比單波段閾值法低,得益于該方法綜合考慮了水體信息在近紅外波段與其他地物的差異性、NDVI和NDWI,可以很好地提取水體信息。
表2 水體與非水體提取結(jié)果細節(jié)對比
表3 水體信息提取結(jié)果統(tǒng)計
為了驗證3種方法對不同類型的水體信息提取精度,采用混淆矩陣表示分類結(jié)果與地表真實信息。首先,采用分辨率為0.5 m的天地圖影像,選取研究區(qū)內(nèi)的湖區(qū)、河流水渠、養(yǎng)殖區(qū)、城市水體與非水體的樣本各50個;然后,在3種方法得到的結(jié)果上分別導(dǎo)入上述樣本,將樣本類別與最終提取分類結(jié)果相匹配,從而得到精度評價,將3種方法提取分類結(jié)果中的“1”匹配至樣本信息中的湖區(qū)、河流水渠、養(yǎng)殖區(qū)、城市水體,“0”匹配至樣本信息中的非水體;最后,輸出混淆矩陣,統(tǒng)計不同類型水體提取的總體精度結(jié)果,如表4所示。從表中可以看出,采用決策樹法提取的各類型水體的精度高于其他2種方法提取的,但在不同類型水體的提取精度上存在差別。當(dāng)提取水體類型為湖區(qū)和河流水渠時,決策樹法優(yōu)于單波段閾值法和NDWI法,單波段閾值法和NDWI法存在河流斷線以及湖泊邊界像元誤提的現(xiàn)象。當(dāng)提取水體類型為養(yǎng)殖區(qū)時,單波段閾值法更優(yōu),養(yǎng)殖區(qū)邊界提取較清晰。當(dāng)提取水體類型為城市水體時,3種方法的提取精度較差,誤提和漏提嚴重,原因是城市水體面積小,且城市水體存在與建筑陰影等暗地物間的光譜信息混淆現(xiàn)象。
表4 不同類型水體提取總體精度結(jié)果
結(jié)果表明,3種方法在綜合考慮各種漏提、誤提以及不同類型水體的提取精度的情況下,精度稍有差別。其中,決策樹法的提取精度最高(98.767 2%),湖泊、河流水渠和養(yǎng)殖區(qū)等水體提取較為完整;其次為單波段閾值法,提取精度為98.152 6%,該方法能夠利用水體的光譜特性來確定閾值,從而實現(xiàn)水體的有效提??;但是,由于部分建筑區(qū)、陰影等地物的波譜特征與水體相似,因此該方法無法精準區(qū)分,可能誤提為水體。NDWI法的提取精度最低(95.297 7%),并且對各類型水體提取的效果都比其他2種方法的差。
本文中以山東省微山縣為研究對象,以GF-1衛(wèi)星遙感影像為數(shù)據(jù)源,基于單波段閾值法、NDWI法及決策樹法提取研究區(qū)的水體信息,得到如下結(jié)論:
1)單波段閾值法、NDWI法及決策樹法按基于GF-1衛(wèi)星遙感影像提取微山湖區(qū)水體信息的精度由高到低依次為決策樹法、單波段閾值法和NDWI法,表明決策樹法更適用于利用衛(wèi)星遙感數(shù)據(jù)提取該研究區(qū)的水體信息。
2)3種方法在進行湖區(qū)開闊水體的提取時效果都較為理想,然而從不同方法呈現(xiàn)的提取細節(jié)來看,部分建筑區(qū)、陰影等地物的波譜特征與水體的相似,導(dǎo)致利用單波段閾值法進行提取時,此類地物的像元存在較嚴重的誤提現(xiàn)象。另外,水體復(fù)雜程度及人為因素對決策樹法和NDWI法的最佳閾值選取的影響較大,從而存在一定程度的漏提和誤提現(xiàn)象。
3)決策樹法提取精度較高,在對不同尺度和多種類型的水體進行提取時較為適用,但隨著節(jié)點數(shù)量增加,運算效率較低;單波段閾值法常出現(xiàn)“異物同譜”的情況,更適用于對單一水體提取;NDWI法提取方法簡單,易操作,但不同水體類型影響其閾值,需要對閾值進行反復(fù)試錯,在對復(fù)雜區(qū)內(nèi)水體提取時效果較差。
本文中在驗證不同方法的水體提取的精度時,不僅驗證了全域影像水體的總體精度,而且驗證了不同方法對不同類型水體的提取精度。在今后的研究中將進一步研究適用于不同水體類型的提取方法,提高復(fù)雜區(qū)水體提取的精度。此外,為了充分推廣國內(nèi)數(shù)據(jù)源的應(yīng)用和發(fā)揮國內(nèi)高分辨率數(shù)據(jù)的優(yōu)勢,下一步將繼續(xù)利用GF-1、高分六號(GF-6)、資源三號(ZY-3)等衛(wèi)星遙感影像數(shù)據(jù)進行水體提取方法的研究,并探索適用于多源遙感數(shù)據(jù)的水體提取方法。