陳煥南,林紅燕,邢?;?/p>
(1.海南經貿職業(yè)技術學院工商管理學院,???571127;2.海南師范大學信息科學技術學院,???571158)
關鍵字:遙感影像;不確定性;分類;模糊集
遙感技術和信息技術的飛速發(fā)展,為我們提供了豐富的遙感數據源,這些高分辨率、高光譜的遙感影像數據為遙感定量化、實用化及產業(yè)化,為自然資源調查、環(huán)境監(jiān)測、災害防治和全球變化等提供了豐富的資料[1]。而遙感影像分類是遙感應用中的關鍵技術,如專題信息提取、專題制圖、動態(tài)變化監(jiān)測、遙感數據庫的建立等都應用到遙感影像分類[2],可以說分類精準度直接影響遙感技術應用的發(fā)展。但由于自然環(huán)境的復雜性、遙感影像數據獲取及其處理方法的局限性等原因,遙感數據分類過程中不確定性不可避免。因此,遙感數據的不確定性已經引起了國內外學者的廣泛重視。Gahegan等[3]提出空間信息不確定框架,從數值、空間、時間、一致性和完備性等方面描述遙感數據的不確定性。承繼成[4]分析了遙感過程中的不確定模型、度量、尺度效應、傳遞、可視化、定量分析及其減少不確定性的方法等。葛詠等[5-6]提出結合遙感機理模型和數據分析的不確定性數據處理方式,并對遙感信息和空間分析過程及結果的不確定性進行可視化表達。Lan等[7]從形式化描述和綜合評價兩個方面提出了一種不確定性表示方法。Rocchini等[8]對生態(tài)系統(tǒng)遙感制圖中的不確定性進行了綜述。
提高地物分類精度一直是遙感影像處理與應用研究的熱點之一,但遙感影像數據固有的不確定性及現(xiàn)有數據處理與分類方法的局限性,顯著影響到遙感影像分類結果的精準度,制約了遙感技術更廣泛的應用。如何科學地表達這些不確定性信息,設計合理的遙感影像數據分類算法,是提高遙感影像分類精準度的關鍵。本文分析了遙感影像數據固有的不確定性,從遙感數據的獲取、處理、轉換和傳播等方面分析遙感影像分類中的不確定性因素,并對遙感影像數據不確定性的處理方法進行歸納。旨在為后續(xù)研究有效的遙感影像數據表達方式和分類方法,以及提高遙感影像分類精度和自動化程度提供參考。
在遙感影像數據分類過程中,從數據轉換、分析與處理、分類算法選取、分類后處理,到最終的精度評價等各個環(huán)節(jié)都不可避免地會引入不同程度與類別的不確定性。而遙感目標類別的多樣性、干擾因素的復雜性、特征信息的可變性也給遙感影像分類帶來極大的挑戰(zhàn)[4]。如何了解這些不確定性的本質,并科學地表達和處理其中包含的不確定性,是提高遙感影像分類精準度的關鍵。
遙感科學技術的理論基礎是建立在地物波普特征上的,由于自然環(huán)境及其與遙感波譜相互作用的復雜性,且遙感影像數據在將連續(xù)的光譜信息用離散點的灰度值表示只是近似表示,這就不可避免地損失信息,這就是遙感影像數據固有的不確定性。主要表現(xiàn)在以下兩個方面:
1.1.1 “同物異譜,異物同譜”現(xiàn)象
地物的電磁波譜特征由其物質成分和結構決定,同類地物在相同的條件下(紋理、地形、光照及植被覆蓋等),應具有相同或相似的光譜信息特征,而不同類型地物其光譜信息特征不同[9]。然而同類地物的成分、成像條件和所處的環(huán)境不同(如濕度、風化程度、生長階段等),其波普特征也會發(fā)生變化,造成同物異譜現(xiàn)象,如作物的不同長勢和干旱地區(qū)稀疏的植被等造成了植被類中不同樣本的差異。而不同類型地物的波普集成帶之間也可能出現(xiàn)重疊現(xiàn)象,造成了異物同譜現(xiàn)象。例如,渾濁的水體和潮濕的土壤在某些波段上表現(xiàn)為混疊現(xiàn)象[10],特征向量之間的差異不明顯,甚至模糊混疊,造成地物類別的模糊不確定性。
“同類地物具有不同的灰度值”和“不同類型地物具有相同或相似的灰度值”現(xiàn)象普遍存在,也是造成遙感影像分類和解譯不確定性的重要原因。可以借助地物的紋理特征、空間分布特征來加以區(qū)分以減少分類或解譯的不確定性。
1.1.2 混合像元
像元是傳感器地面掃描采樣的最小單位,是遙感數字化圖像的基本單元。由于空間分辨率的原因,一個像元內可能存在多種不同類型的地物,主要出現(xiàn)在土地覆蓋復雜、不同地物類別的交界區(qū)域。對于空間分辨率比較低的遙感影像數據,混合像元問題比較突出,而混合像元的存在嚴重影響著遙感影像地物分類精度??梢酝ㄟ^使用高分辨率的遙感影像減少混合像元,通過了解相關地物的空間分布規(guī)律,以減少分類中的不確定性。
從客觀世界三維地理空間獲取二維遙感影像數據的過程,這一映射過程本身就存在信息缺失。此外,遙感信息傳輸的各個環(huán)節(jié)都會在不同程度上受到太陽入射角、遙感傳感器姿態(tài)、地球自轉、地形起伏以及大氣作用等客觀因素的影響(如圖1所示),遙感數據存在一定程度的幾何及輻射失真。地球表面的物體普遍存在季節(jié)性差異,且不同時期的傳感器成像條件不同,會導致在不同時期的影像中同種地物的光譜信息會有所不同。因此,遙感數據在刻畫真實的地表環(huán)境時存在一定的不確定性。
圖1 數據獲取階段的不確定性[11]
傳感器系統(tǒng)的特性深刻地影響著遙感圖像質量和遙感信息的不確定性。遙感數據的輻射分辨率、空間和時間分辨率,遙感影像數據的信噪比都受到傳感器物理參數的影響。而傳感器系統(tǒng)的穩(wěn)定性亦受到飛行速度、衛(wèi)星平臺的穩(wěn)定性、自然條件等因素的影響。因此,傳感器系統(tǒng)會造成遙感影像數據的不確定性。
幾何校正和輻射校正是兩種基本的遙感數據預處理方法,能夠有效降低數據獲取階段的不確定性。由于受到大氣條件、地表地形、太陽輻射等因素的影響導致接收的信號不能準確反映地表物理特征,輻射校正的目的是消除交雜在遙感圖像所記錄的輻射亮度上的各種干擾,以正確反映目標物的反射和輻射特性。而由于遙感器自身和成像條件等因素的影響,造成所獲取的遙感圖像存在幾何變形,幾何校正是為了使遙感圖像上記錄的地物輻射量和地面真實目標一一對應。幾何校正一般是基于遙感器物理和概念模型,且基于地面控制點輔助下完成,而模型和地面控制點的誤差都會給幾何校正帶來一定程度的不確定性。遙感數據提供商會在提供數據之前,先根據傳感器參數和大氣參數對由傳感器內部因素及大氣狀況引起的輻射畸變進行校正,用戶只需對多時期遙感影像做相對輻射校正和幾何配準。輻射和幾何校正后遙感圖像數據也不能始終和地面實況完全一致,因此,所殘余的光譜和幾何誤差亦帶來遙感影像數據的不確定性。此外,影像融合、影像增強或特征提取、數模轉換等處理過程都會產生誤差,從而造成一定的不確定性。
無論是從矢量數據到柵格數據還是從柵格到矢量的轉換,在投影變換過程、數據的網絡傳輸過程中都會產生新的不確定性。遙感影像數字化即用傳感器對地面掃描成像,將地面真實場景反射的電磁波信息生成連續(xù)的模擬圖像,然后再將模擬圖像離散化為數字圖像。把模擬圖像離散化成數字矩陣的過程中,也就是把連續(xù)的地磁輻射能量用有限的離散數字值來表示,即用灰度值來表示。因此遙感數據只是近似表示,不可避免的造成數據丟失,必然產生不確定性。
另外,傳感器接收到的電磁波是微弱的物理量,需放大或增益。而在放大或增益過程中可能是線性,也可能是非線性的。因此得到的模擬圖像只是地物的相對近似,亦會造成不確定性。遙感數據的投影變換過程,傳輸過程中信息的衰減和增益、壓縮和解壓縮等,都會造成誤差傳播和累積。因此,在遙感數據的轉換和傳播過程中不確定性不可避免,并影響后續(xù)的分析和應用。
遙感影像數據自動分類就是通過計算機按照一定的準則將遙感圖像中的各個像元依據某些特征劃分為不同的類別,賦予不同的類別標簽[9]。為了從遙感影像中獲取有效的地表覆蓋信息,學者們針對不同類型的遙感影像設計了多種遙感影像分類算法,如人工神經網絡、支持向量機、最大似然分類、K-Means聚類、模糊C均值聚類等,以及一系列的改進算法。此外,出現(xiàn)了面向對象的高分辨率遙感圖像分類方法[12],基于稀疏表示[13]、集成學習方法[14]、深度學習[15]等高光譜遙感圖像的分類新方法。無論使用基于光譜的還是面向對象的分類方法,當連續(xù)的光譜信息轉換為一組離散的類別時,所使用的遙感數據處理和圖像分類方法將涉及信息的丟失,這導致遙感數據分類過程存在不確定性[16]。分類過程中存在的不確定性主要包括:①分類模型及參數選擇的不確定性。②樣本及特征選擇的不確定性。③分類精確性評估的不確定性。
近年來,越來越多的學者開始關注遙感圖像分類的可靠性問題。1984年Wilson和Granlund就建議考慮不確定性對整個圖像處理流程的影響[17]。Giacco等研究了具有紋理特征的多光譜遙感數據分類問題,重點分析了生成的土地覆蓋圖過程中的不確定性[18]。Shi等提出了評價土地覆蓋產品可靠性的驗證方案,包括結果可靠性和過程可靠性評價[19]。Feizizadeh提出了一種將模糊綜合評判和Dempster-Shafer理論相結合的方法,應用于基于對象的圖像分類中的空間不確定性分析和精度評估[20]。2018年,Wang等針對高分辨率遙感圖像像素級的不確定性和分類決策導致分類精度下降的問題,提出了一種基于區(qū)間二型模糊隸屬度函數的高分辨率遙感圖像有監(jiān)督分類方法[21]。同年,Jiang等引入三角形模糊集建模來描述對象的特征,并針對高分辨率遙感聚類問題,提出了一種基于三角模糊集建模和單模糊器的區(qū)間二型模糊聚類增強算法[22]。2019年,Zhang等指出定量描述和研究遙感圖像固有的不確定性對實現(xiàn)可靠的遙感圖像分類至關重要,并提出一種遙感影像不確定性的定量描述方法[23]。2019年,Xing等針對遙感影像中復雜的空間相關性及同類地物異質性所造成的地物類別不確定性,提出一種結合鄰域信息的區(qū)間二型模糊隸屬函數構建方法[24]。Xu等針對遙感圖像的不確定性和問題的病態(tài)性,傳統(tǒng)的無監(jiān)督分類算法很難建立準確的分類模型,提出一種基于半監(jiān)督自適應區(qū)間二型模糊C均值算法(SS-AIT2FCM)[25]。
目前,對于遙感數據不確定性的分析處理方法亦沿用著一般的不確定性分析理論,主要有:模糊集理論、多元統(tǒng)計分析、粗糙集理論、信息熵、回歸分析、敏感性分析、灰色系統(tǒng)理論、貝葉斯估計等。
實際應用中經常會涉及到模糊不確定、不精確或不完整的數據,處理這種模糊不確定性數據通常使用模糊集理論。例如,農作物的不同長勢和干旱地區(qū)稀疏的植被等造成植被類中不同樣本的差異,渾濁的水體和潮濕的土壤在某些波段上表現(xiàn)為混疊現(xiàn)象等[11],此類遙感影像數據導致遙感影像分類等處理面臨著模糊不確定性?;谀:侠碚摰哪:鼵-均值聚類算法(fuzzy c-mean clustering,F(xiàn)CM),已經廣泛應用于遙感影像地物分類和目標分割等分析處理[26-27],具有較好的魯棒性。二型模糊集合適用于描述數據的多重不確定性,為了更好地刻畫和控制遙感影像數據分類中的高階不確定性,學者將二型模糊集合引入遙感影像數據不確定性描述及遙感土地覆蓋分類[28-29]。
多元統(tǒng)計分析研究客觀事物中多個變量(或多個因素)之間相互依賴的統(tǒng)計規(guī)律性。多種遙感數據處理及專題信息提取都是以多元統(tǒng)計分析為基礎展開的,其基本原理是將遙感數字圖像中像元值視為具有統(tǒng)計分布特征的隨機變量,并從統(tǒng)計分析的角度進行各種圖像預處理、變換、增強及圖像分類處理。遙感數據的基本統(tǒng)計特征包括單波段遙感數據的均值、眾數、標準差等基本統(tǒng)計量,以及多波段遙感數據的協(xié)方差、相關系數,包括圖形方式的直方圖、散點圖等統(tǒng)計特征。均值、中值、眾數這三個統(tǒng)計量物理意義相近,代表了圖像中地物的平均輻射強度或代表圖像中分布最廣的地物的輻射特性。標準差在數學意義上反映了圖像中像元值的總體離散程度,其物理意義是反映了圖像中各類地物之間的輻射特性差異。所以,遙感影像數據的基本統(tǒng)計特征分析在遙感圖像不確定性處理中占有重要的地位,對遙感影像數據專題信息提取至關重要[30-31]。
粗糙集是波蘭理工大學Z.pawlak教授提出用來研究不完整數據,不精確知識的表達、學習、歸納等的一套理論。粗糙集理論除了能對不精確、不完整的各種不完備信息進行表達和分析之外,還可以對這些數據進行推理,從這些不確定性數據中發(fā)現(xiàn)隱含的知識,并揭示其潛在的規(guī)律。粗糙集作為一種處理模糊和不確定性問題的數學工具和知識獲取的智能手段,已廣泛應用于模式識別、圖像處理和數據分析等諸多研究領域,在遙感影像分類、特征選擇等方面也取得了較好效果[32-33]。
熵在概率論中用作描述隨機試驗的不確定性程度的度量標志。信息論之父香農于1948年發(fā)表論文A Mathematical Theory of Communication,指出:任何信息都存在冗余,冗余大小與信息中每個符號(數字、字母或單詞)的出現(xiàn)概率或者說不確定性有關。香農提出“信息熵”的概念,解決了對信息的量化度量問題。在遙感影象處理中,信息熵是遙感數據不確定性的度量方法之一,被用作同一類地物的影象亮度值的分散程度和均勻程度的度量。目前,信息熵被廣泛應用于遙感影像分類的不確定性度量[34-35]。
回歸分析是研究因變量對自變量之間相關關系的一種統(tǒng)計分析方法,目的是通過自變量來估計或預測因變量的值?;貧w分析是一種常用的遙感信息建模方法,在遙感影像處理中經常需要根據遙感影像特征參數與地面物體或特征的相關性進行數學建模,如幾何光學模型、輻射傳輸模型、土地利用變化模型并進行相關分析[36-37]。
敏感性分析方法可以用于定性或定量地評價模型輸入、模型參數對模型輸出的重要性程度,是模型輸入選擇和模型參數校正的有用工具。其核心目的是通過對模型參數進行分析,確定模型各參數對輸出結果影響的大小,分析哪些參數最容易引起模型不確定性,在模型參數選擇和校正過程中重點考慮那些對輸出結果影響大的參數。通常應用于遙感數學模型的不確定性分析,有效篩選出遙感圖像中對分類貢獻較大的特征波段等[38-39]。
遙感影像數據的不確定性及現(xiàn)有處理方法的局限性,顯著影響到遙感影像分類結果的精準度,制約了遙感更廣泛的應用。在遙感影像數據處理的各個環(huán)節(jié)都存在著不同程度不同類型的不確定性,如何科學地表達這些不確定性信息,并對其不確定性進行有效的定量評估,從而盡量避免或減少數據的不確定性對遙感影像分類的影響是一個十分重要的課題。本文分析了遙感影像數據固有的不確定性,從遙感數據的獲取、處理、轉換、傳播等方面分析遙感影像分類中的不確定性因素,并對遙感影像數據不確定性的處理方法進行歸納。為后續(xù)研究有效的遙感影像數據不確定性建模和分類方法,以提高遙感影像分類自動化程度和可靠性提供有效的參考。