劉宏潔,宋文龍,劉昌軍,盧奕竹,曲 偉,唐 銳,桂榮潔,3
(1.中國水利水電科學研究院,北京 100038;2.陜西航天技術應用研究院,陜西 西安 710000;3.首都師范大學 資源環(huán)境與旅游學院,北京 100871)
基于光學衛(wèi)星影像的主要水體提取方法有單波段閾值法、多光譜波段法、水體指數(shù)法、光譜匹配法等[1-7]。水體指數(shù)法是利用衛(wèi)星多光譜遙感影像提取水體信息的一種重要方法,以其應用簡便、精度較高等優(yōu)點而被廣泛應用[8-11]。利用NDWI提取水體信息,其閾值確定與修正對于其在不同水質條件下的適用性至關重要[11-12]。
水體指數(shù)法以歸一化水體指數(shù)(NDWI)與改進的歸一化水體指數(shù)(MNDWI)應用較多[8-11],然而考慮到許多高分辨率衛(wèi)星影像不具備短波紅外,因此在高分辨率的水體提取中NDWI仍為第一選擇[13]。由于水體在紅外波段的反射率比可見光波段的反射率更低[3-6,11],水體的NDWI值大于零,而植被、裸露土地、建設用地等地物的NDWI值小于零,因此通常以0為閾值對NDWI進行二值化分割[14]。云霧冰雪由于散射嚴重導致各個波段輻射率較高,在衛(wèi)星影像的各個波段都呈亮白色,計算得到的NDWI值雖較植被、裸地要高,與液態(tài)水體較為接近,但是總體仍然低于液態(tài)水體,并且通常小于0[14-15],因此以0為閾值可以排除絕大部分將云霧誤分為水體的情況;然而,泥沙含量較高的水體,對可見光的反射率明顯提高[16],并且受泥沙含量和泥沙的粒徑影響;當水體富營養(yǎng)化時會減少對紅外波段的吸收[17],最終導致NDWI對水體的區(qū)分度減弱。因此簡單以0為閾值對存在云霧、泥沙和富營養(yǎng)化等水體的提取誤差較高,需要根據(jù)云霧、水質等實際情況對閾值做出自適應調整,才能提高NDWI方法的適用性[18-19]。最大類間方差算法(OTSU算法)具有簡單快速的優(yōu)點[20-21],袁欣智等[22]對NDWI使用OTSU閾值確定方法進行了局部自適應閾值水體提取,相對于全局閾值一定程度上改善了地形陰影與建筑物等的影響,但自定義閾值的確定與局部范圍的大小和水體非水體的比例等有直接關系;Li等[23]采用了OTSU與均勻度測量結合的方法進行分割,增強了傳統(tǒng)OTSU抗噪聲性能,認為改進的OTSU方法提高了水體提取的精度、降低了錯誤率,但由于分割背景較大、目標較小,因此存在虛假分割問題;Jiali Shao等[24]基于FY-4a影像使用OTSU算法結合線性光譜分解法自動提取南亞洪水信息,認為可以得到可靠的水體信息。水體像元與非水體像元的占比不均衡,會造成OTSU自適應閾值偏大,不適用于具有明顯豐水期和枯水期的水體。YANG P等[25]基于均值漂移算法(Mean-Shift)提取水面漂浮物,認為該方法有效可行但存在視覺誤差,JIA Hu等[26]使用Mean-Shift算法結合NDVI的邊緣監(jiān)測信息提取了東洞庭湖的濕地信息,認為比單獨使用Mean-Shift算法取得更好的效果;BENGOUFA S等[27]基于Mean-Shift分割算法對海岸線進行監(jiān)測與提取,并給出最佳參數(shù)設置,但提取精度不及多分辨率分割(MRS)方法。Mean-Shift算法是一種廣泛使用的圖像算法[28],但其在水體信息提取方面的應用研究相對較少。
本文基于Landsat-8與高分一號(GF-1)光學多光譜影像,使用歸一化水體指數(shù)(NDWI)常用閾值0(TH0)、OTSU自適應閾值(THotsu)以及Mean-Shift自適應閾值(THMS)對正常水體、云霧覆蓋水體、高含泥沙水體及富營養(yǎng)化典型水體進行水體信息提取、精度對比與方法適用性分析,為復雜條件下的水體信息遙感反演提供方法參考。
2.1 研究方法
(1)歸一化水體指數(shù)(NDWI)。歸一化水體指數(shù)(NDWI)由Gao于1996年提出[29],計算公式如下:
式中B2與B4為光學多光譜影像中的綠光波段和近紅外波段的反射率。NDWI指數(shù)可以最大程度地抑制植被信息進而突出水體特征。
(2)最大類間方差算法(OTSU)。最大類間方差算法(OTSU)最早由日本學者NOBUYUKI OTSU提出[20],是一種自適應閾值確定方法。
假設存在閾值TH將圖像所有像素分為兩類C1(小于TH)和C2(大于TH),則這兩類像素各自的均值為m1、m2,圖像全局均值為mG,同時像素被分為C1和C2類的概率分別為p1、p2,則有:
根據(jù)方差的概念,則類間方差為:
將式(2)代入式(4)進行簡化得:
采用遍歷的方法使得σ2最大化的灰度級K即為OTSU閾值。
(3)均值漂移聚類算法(Mean-Shift)。均值漂移聚類算法(Mean-Shift)最初由Fukunaga等人提出[30],直到1995年Cheng等人發(fā)表的文獻定義了核函數(shù)和權值系數(shù)[31],才使Mean-shift算法得到了廣泛應用[32-33]。Mean-Shift算法的基本思想如下:
在直方圖橫軸上均勻設置一定數(shù)量的初始聚類中心;按照給定的聚類半徑按照均值漂移的方法移動這些聚類中心,并記錄每個距離中心的移動方向;當聚類中心穩(wěn)定后,移向某聚類中心的初始聚類中心之間的值都劃歸本類別。
其形式化定義為:
式中:xi為待聚類的樣本點;yk為點的當前位置;yk+1為點的下一個位置;h為帶寬。
2.2 數(shù)據(jù)源 所用遙感數(shù)據(jù)為Landsat-8 OLI光學多光譜影像與GF-1WFV光學多光譜影像。其中,Landsat-8是NASA與美國地質調查局(USGS)合作開發(fā),攜帶陸地成像儀(Operational Land Imager,OLI)和熱紅外傳感器(Thermal Infrared Sensor,TIRS),影像空間分辨率為30 m。GF-1是高分辨率對地觀測系統(tǒng)國家科技重大專項的首發(fā)星,配置了2臺2 m空間分辨率全色/8 m空間分辨率多光譜相機,4臺16 m空間分辨率多光譜寬幅相機。需要指出的是,在有厚重云霧覆蓋的情況下,如果沒有特殊的技術手段與其他信息輔助的話,水體信息提取的準確度難以保證,因此本文選擇云霧覆蓋影像時主要選取薄霧覆蓋影像。所選影像具體信息如表1。
表1 選用的遙感影像信息
基于Landsat-8與GF-1光學多光譜影像,使用歸一化水體指數(shù)法閾值0(TH0)、最大類間方差法(OTSU)自適應閾值(THotsu)與均值漂移聚類算法(Mean-Shift)自適應閾值(THMS)對典型正常水體、云霧覆蓋水體、富營養(yǎng)化水體、高含泥沙水體進行水體遙感提取與效果分析。
(1)提取結果?;贚andsat-8與GF-1多光譜影像提取的密云水庫正常水體的NDWI分別如圖1(a)與圖1(b)所示,其影像無云霧覆蓋、無結冰、含泥沙與微生物較少,可看到水體部分呈亮白色,非水體部分呈暗色?;贚andsat-8影像,使用TH0、THotsu、THMS的水體提取結果分別如圖1(c)、圖1(e)和圖1(g)所示。由圖可知,TH0與THMS均能較好提取出水體區(qū)域,邊界清晰連貫;而THotsu所提取的水體區(qū)域不完整,在西南側有缺失,邊界破碎不連貫?;贕F-1影像,使用TH0、THotsu、THMS的水體提取結果分別如圖1(d)、圖1(f)和圖1(h)所示。由圖可知,TH0、THotsu、THMS均能較好的提取出水體范圍,邊界較連貫,且無明顯水體缺失。
圖1 密云水庫正常水體NDWI值及水體信息提取結果圖
(2)精度分析。基于Landsat-8與GF-1多光譜影像,對水體指數(shù)法TH0、THotsu以及THMS遙感反演提取的密云水庫正常水體信息結果進行混淆矩陣精度分析,如表2所示?;贚andsat-8影像,TH0提取精度最高,總精度為95%,Kappa系數(shù)為0.89;THMS提取結果也較為理想,總精度為89%,Kappa系數(shù)為0.78;而THotsu提取精度最低,為82%,Kappa系數(shù)為0.62,主要原因是水體與非水體像元占比不均衡導致OTSU自適應閾值THotsu偏高,水體西南側NDWI值較低,因此西南側水體像元錯分現(xiàn)象較為嚴重?;贕F-1影像,TH0、THotsu與THMS提取精度均較為理想,分別為94.32%、91.12%和93.11%,Kappa系數(shù)分別為0.88、0.82與0.86。由表2可知,對于正常水體,Landsat-8或者GF-1多光譜影像對于提取結果無明顯影響。
表2 正常水體在不同數(shù)據(jù)源與閾值下提取結果的混淆矩陣
(1)提取結果?;贚andsat-8與GF-1多光譜影像提取的云霧覆蓋下黃河中游某段水體的NDWI分別如圖2(a)與圖2(b)所示?;?Landsat-8影像,使用TH0、THotsu、THMS的水體提取結果分別如圖2(c)、圖2(e)和圖2(g)所示。由圖可知,盡管TH0沒有將云霧錯分為水體,但在有云霧遮蓋的地方,即使云霧覆蓋量較低,也無法將水體信息有效提取出來;THotsu對于水體信息的提取有更多的遺漏;與TH0、THotsu提取效果相比,THMS對少量云霧覆蓋下的水體信息有較好的提取效果。基于GF-1影像,使用TH0、THotsu、THMS的水體提取結果分別如圖 2(d)、圖 2(f)和圖 2(h)所示。由圖可知,TH0提取效果同Landsat-8數(shù)據(jù)源效果一致,在有薄霧覆蓋的地方,無法有效提取水體信息;THotsu水體提取范圍更破碎且邊界更加不連貫;THMS水體提取效果優(yōu)于TH0、THotsu,在可目視判斷出水體的位置基本有效提取出水體信息,而在云霧覆蓋稍厚的位置(如圖2(b)左側位置)也較難有效提取出水體信息。
圖2 云霧覆蓋下黃河中游某段水體NDWI值及水體信息提取結果圖
(2)精度分析。基于Landsat-8與GF-1多光譜影像,對水體指數(shù)法TH0、THotsu以及THMS遙感反演提取的云霧覆蓋下黃河中游某段水體信息結果進行混淆矩陣精度分析,如表3所示?;贚andsat-8影像,THMS提取精度最高,總精度為97%,Kappa系數(shù)為0.94,此方法對少量的云霧覆蓋水體仍具有較高的提取精度;TH0提取結果總精度為85%,Kappa系數(shù)為0.53;THotsu提取精度最低,總精度為79%,Kappa系數(shù)為0.31?;贕F-1影像,THMS提取精度最高,總精度為89.13%,Kappa系數(shù)為0.72;TH0與THotsu提取結果總精度分別為75.44%與73.05%,Kappa系數(shù)僅為0.17與0.06。由表3可知,THMS對少量云霧覆蓋水體仍具有相對樂觀的提取精度;而對于TH0,水體非水體像元錯分現(xiàn)象較為嚴重,主要集中在云霧覆蓋處,說明即使是少量云霧覆蓋也對此閾值有較大影響;而由于云霧覆蓋以及水體像元與非水體像元占比不均衡原因,導致THotsu提取效果最差;對于少量云霧覆蓋下的水體,Landsat-8較GF-1多光譜影像具有更高的提取精度。
表3 云霧覆蓋水體在不同數(shù)據(jù)源與閾值下提取結果的混淆矩陣
(1)提取結果。選取的洱海水體富營養(yǎng)化較為嚴重[34],基于Landsat-8與GF-1多光譜影像提取的NDWI分別如圖3(a)與圖3(e)所示?;贚andsat8影像,使用TH0、THotsu以及THMS的水體提取結果分別如圖3(b)、圖3(c)和圖3(d)所示,三種方法均能將水體邊界識別出,但THotsu對于藻類微生物較多處難以進行有效的水體提取,在圖3(a)中也可看出洱海中部水體藻類微生物較多處NDWI值偏低?;?GF-1影像,使用 TH0、THotsu、THMS的水體提取結果分別如圖 3(f)、圖 3(g)和圖 3(h)所示,由圖3(e)可知,此幅影像無較為嚴重的水藻聚集,而TH0、THotsu、THMS均可較好的提取出水體信息,邊界連貫,水體無破碎。
圖3 富營養(yǎng)化洱海水體NDWI值及水體信息提取結果圖
(2)精度分析?;贚andsat-8與GF-1多光譜影像,對水體指數(shù)法TH0、THotsu以及THMS遙感反演提取的富營養(yǎng)化洱海水體結果進行混淆矩陣精度分析,如表4所示?;贚andsat-8影像,THMS提取精度最高,總體精度為97%,Kappa系數(shù)為0.93;TH0提取結果精度也較理想,總體精度為96%,Kappa系數(shù)為0.91;THotsu提取精度最低,總體精度僅為66%,Kappa系數(shù)僅為0.35,水體像元錯分為非水體像元的情況主要集中在富營養(yǎng)化較嚴重的水體處。基于GF-1影像,TH0與THMS提取總精度均較高,分別為93.19%與93.28%,Kappa系數(shù)分別為0.87與0.86;而THotsu提取總精度為80.11%,Kappa系數(shù)為0.60。由表4可知,對于富營養(yǎng)化水體,TH0與THMS提取精度均較高,且數(shù)據(jù)源對提取精度的影響表現(xiàn)出一致性,即Landsat-8較GF-1多光譜影像具有更高的水體提取精度;而基于GF-1的THotsu提取精度更低,因為該高分影像富營養(yǎng)化較嚴重處NDWI值較低,因此導致錯分現(xiàn)象較為嚴重。
表4 富營養(yǎng)化水體在不同數(shù)據(jù)源與閾值下提取結果的混淆矩陣
(1)提取結果。選取的黃河下游某段水體的含泥沙量較高,基于Landsat8與GF-1多光譜影像提取的NDWI分別如圖4(a)與圖4(e)所示。基于Landsat-8影像,使用TH0、THotsu以及THMS的水體提取結果分別如圖4(b)、圖4(c)和圖4(d)所示。TH0和THMS水體提取效果都比較理想,均好于THotsu提取效果?;贕F-1影像,使用TH0、THotsu以及THMS的水體提取結果分別如圖4(f)、圖4(g)和圖4(h)所示,THMS可較好的提取出水體范圍,TH0基本提取出水體范圍,但潛水區(qū)出現(xiàn)水體破碎,而THotsu提取效果較差,水體破碎不連續(xù)情況較為嚴重。
圖4 高含泥沙黃河下游某段水體NDWI值及水體信息提取結果圖
(2)精度分析。基于Landsat-8與GF-1多光譜影像,對水體指數(shù)法TH0、THotsu以及THMS遙感反演提取的高含泥沙黃河下游某段水體結果進行混淆矩陣精度分析,如表5所示。基于Landsat 8影像:THMS提取精度最高,總體精度為94%,Kappa系數(shù)為0.88;TH0提取結果總體精度為93%,Kappa系數(shù)為0.87;THotsu提取精度最低,總體精度為75%,Kappa系數(shù)為0.52?;贕F-1影像:THMS提取總精度最高,為91.54%,Kappa系數(shù)為0.83;而TH0和THotsu提取效果一般,水體像元錯分為非水體像元情況較為嚴重,其中TH0總精度稍高,為72.64%,Kappa系數(shù)為0.44,THotsu總精度為65.67%,Kappa系數(shù)僅為0.30。由表5可知,對于THotsu和THMS,基于Landsat-8多光譜影像的水體提取總精度更高;TH0總精度差距較大,這可能是由于數(shù)據(jù)源問題導致影像NDWI值整體偏低,THotsu和THMS作為自適應閾值可對閾值大小自動做出調整,而TH0為固定閾值。
表5 高含泥沙水體在不同數(shù)據(jù)源與閾值下提取結果的混淆矩陣
針對光學多光譜衛(wèi)星影像提取水體信息中歸一化水體指數(shù)(NDWI)法閾值選取與自適應修正問題,基于Landsat-8和GF-1數(shù)據(jù)源,使用歸一化水體指數(shù)法閾值0(TH0)、最大類間方差法(OTSU)自適應閾值(THotsu)與均值漂移聚類算法(Mean-Shift)自適應閾值(THMS)分別對典型正常水體、云霧覆蓋水體、富營養(yǎng)化水體、高含泥沙水體開展了水體遙感提取與適用性效果分析研究,得到如下主要結論:
(1)對于正常水體,Landsat-8和GF-1多光譜影像表現(xiàn)出相同的規(guī)律,TH0提取精度最高,THMS次之,THotsu最低,THotsu提取效果受影像范圍內水體與非水體像元占比影響。
(2)對于云霧覆蓋的水體,少量云霧覆蓋下THMS仍然具有較高的水體提取精度,TH0提取精度次之,THotsu提取精度最低,且Landsat-8多光譜影像較GF-1多光譜影像具有更高的水體提取精度。
(3)對于富營養(yǎng)化水體,THMS與TH0均表現(xiàn)出較高的提取精度,且Landsat-8多光譜影像較GF-1多光譜影像具有更高的水體提取精度;而THotsu表現(xiàn)出差異,這可能由兩幅影像的水體部分富營養(yǎng)化程度不同導致,且可看出富營養(yǎng)化更嚴重的區(qū)域水體提取精度更低。
(4)對于高含泥沙水體,THMS提取精度最高,THotsu提取精度較低,Landsat-8多光譜影像較GF-1多光譜影像具有更高的水體提取精度;而基于GF-1多光譜影像TH0的提取精度較低,可能與傳感器等數(shù)據(jù)源問題導致影像整體NDWI偏低有關。
通常情況下應用歸一化水體指數(shù)法閾值0(TH0)即可對光學多光譜衛(wèi)星影像提取出較高精度的水體信息,均值漂移聚類算法(Mean-Shift)自適應閾值(THMS)適應于復雜條件尤其是少量云霧覆蓋下的水體信息提取,對于不同條件下的水體可通過調整聚類半徑來實現(xiàn)水體的高精度提取,建議聚類半徑為1~13,當水體與非水體像元NDWI值差異較大時減小聚類半徑會取得更好的提取效果,反之則增大聚類半徑。