李 瑄,李大成,2,陳金勇,孫 康
(1.太原理工大學(xué) 礦業(yè)工程學(xué)院,太原 030024;2.高分辨率對地觀測系統(tǒng)山西數(shù)據(jù)與應(yīng)用中心,山西 晉中 030600;3.中國電子科技集團(tuán)第五十四研究所,石家莊 050081)
遙感影像土地覆蓋分類具有覆蓋范圍廣、分類速度快的優(yōu)點,在準(zhǔn)確檢測開發(fā)土地利用情況方面應(yīng)用非常廣泛[1-3]。由于存在“同一物體具有不同光譜,而不同物體具有相同光譜”的現(xiàn)象,當(dāng)使用單時相影像來提取土地利用情況時,信息提取的準(zhǔn)確性受到嚴(yán)重影響。由于受衛(wèi)星重訪周期和天氣的影響,難以獲得足夠多的高質(zhì)量的時間序列影像來進(jìn)行土地覆蓋分類。在遙感數(shù)據(jù)源方面,連續(xù)的高分辨率遙感影像數(shù)據(jù)對準(zhǔn)確記錄地物特征意義重大。因此用于融合不同時空分辨率遙感數(shù)據(jù),以獲取連續(xù)高分辨率數(shù)據(jù)的時空融合模型得到了廣泛應(yīng)用。
在變換模型的融合方法中,主要是小波變換,即對影像進(jìn)行小波分解,然后對分解后的各層進(jìn)行融合處理,通過小波變換來實現(xiàn)影像的融合[4]。其中MALENOVSKY et al[5]首先通過小波變換的方法,將MODIS和TM影像數(shù)據(jù)進(jìn)行了融合。ACERBI-JUNIOR et al[6]運用三層分解方法,為最小失真情況下的原圖像分辨率的提升構(gòu)建了概念框架。在重構(gòu)的時空融合模型中,最為流行的是由GAO et al[7]提出的STARFM(spatial and temporal adaptive reflence fusion model,STARFM)算法,并且在后續(xù)得到廣泛的研究與應(yīng)用;ZHU et al[8]提出的ESTARFM(enhanced spatial and temporal adaptive reflence fusion model,ESTARFM)算法改進(jìn)了STARFM算法,逐漸成為使用最為廣泛的時空融合算法。
在學(xué)習(xí)模型的融合方法中,HUANG et al[9]利用稀疏表達(dá)與字典學(xué)習(xí)提出了基于稀疏表達(dá)的時空融合模型,用非線性的方式得到了包含高低分辨率空間細(xì)節(jié)的字典對,使用字典對重建預(yù)測時刻的高分辨率影像。
在時空融合技術(shù)的應(yīng)用方面,JIA et al[10]通過融合生成高分辨率NDVI數(shù)據(jù),提取高分辨率時間序列NDVI數(shù)據(jù)中的物候特征,與Landsat數(shù)據(jù)的光譜數(shù)據(jù)集成,實現(xiàn)了分類精度的提升;DENG et al[11]使用ESTARFM時空融合模型融合Landsat和MODIS數(shù)據(jù)并獲得時間序列高分辨率影像,使用基于對象的分類方法提取土地利用信息,得到了較好的分類精度;CHEN et al[12]通過融合MODIS、HJ-1A以及DEM等多源數(shù)據(jù),證明了時間、光譜、角度和地形特征的融合數(shù)據(jù)比原始遙感數(shù)據(jù)具有更高的土地利用分類精度。
當(dāng)前時空融合技術(shù)在土地覆蓋分類上的應(yīng)用均為探索性研究,對融合方法與分類方法的協(xié)同機(jī)制方面缺少相應(yīng)的應(yīng)用檢驗。因此,本文采用典型時空融合模型來生成研究區(qū)多時相的Landsat-5 TM反射率數(shù)據(jù),在隨機(jī)森林、最大似然與支持向量機(jī)分類器的支持下,對比分析了時空融合方法與分類器的協(xié)同分類結(jié)果及其精度表現(xiàn),驗證了該協(xié)同機(jī)制的具體表現(xiàn),進(jìn)一步完善了相關(guān)研究。
基于對地物類型與氣候變化的考慮,本文選擇了遼寧省朝陽市西部地區(qū)作為實驗研究區(qū)(如圖1所示)。該研究區(qū)主要覆蓋朝陽市轄區(qū)與朝陽縣,地理范圍為東經(jīng)118°50′—121°17′,北緯40°25′—42°22′,總面積共5 625 km2,屬北溫帶大陸性季風(fēng)氣候,地物類型包括建筑物、農(nóng)田、林地、水體、裸地。
圖1 研究區(qū)遙感影像Fig.1 Remote sensing image of studied area
本文篩選了2008-03-13-2009-02-02間的無云Landsat和MODIS數(shù)據(jù)為最終的實驗數(shù)據(jù),Landsat數(shù)據(jù)需進(jìn)行正射校正、輻射定標(biāo)以及大氣校正等處理,MODIS數(shù)據(jù)需進(jìn)行重投影及重采樣處理。所采用的具體數(shù)據(jù)信息如表1所示。為驗證分類結(jié)果的精度并進(jìn)行對比分析,收集了研究區(qū)2008年的土地利用調(diào)查資料及其處理成果作為參考分類數(shù)據(jù)源,用于對分類結(jié)果的精度評定。
表1 遙感數(shù)據(jù)信息Table 1 Remote sensing data information
采用多種時空融合模型對研究區(qū)多時相30 m分辨率影像數(shù)據(jù)進(jìn)行融合重建以及質(zhì)量評價。依據(jù)重建數(shù)據(jù)進(jìn)行土地利用分類,并研究時間特征信息對分類精度變化的影響。實驗流程如圖2所示。
圖2 實驗流程Fig.2 Experimental procedure
時空融合是一種在現(xiàn)有高低分辨率影像數(shù)據(jù)對的基礎(chǔ)上,運用特定的算法,實現(xiàn)對預(yù)測時期高分辨率影像融合重建的方法。由于時空融合模型在不同區(qū)域的適用程度不同,融合重建結(jié)果質(zhì)量會有一定差異,因此本文選用STARFM、ESTARFM與半物理3種時空融合模型,分別對研究區(qū)時序數(shù)據(jù)進(jìn)行重建和質(zhì)量評價,以探索重建質(zhì)量與時序數(shù)據(jù)分類結(jié)果精度的關(guān)系。
2.1.1STARFM時空融合模型
STARFM時空融合模型是由GAO et al[7]提出的一種通過基礎(chǔ)時相的高低分辨率影像和預(yù)測時期的低分辨率影像,實現(xiàn)預(yù)測時期的高分辨率影像融合重建的算法。該模型是在原始數(shù)據(jù)的基礎(chǔ)上,設(shè)定一個滑動窗口,搜索窗口內(nèi)與中心像元的光譜特征相似的像元,進(jìn)而計算臨近像元的距離權(quán)重和轉(zhuǎn)換系數(shù),實現(xiàn)對預(yù)測時相高分辨率影像的重建。其計算公式為:
(1)
2.1.2ESTARFM時空融合模型
ESTARFM時空融合模型是由ZHU et al[8]提出的一種基于雙數(shù)據(jù)對的時空融合算法,具有相對較高的融合質(zhì)量,應(yīng)用極為廣泛。首先通過確定滑動窗口的大小,在兩個時相影像數(shù)據(jù)對中遍歷搜索與中心像元光譜相似的像元;然后,利用兩個時相高低分辨率影像以及預(yù)測時相的低分辨率影像計算相似像元的時間權(quán)重。最后,根據(jù)時間權(quán)重與相似像元的各類權(quán)重計算中心像元,實現(xiàn)對預(yù)測時相影像的重建。其中心像元的重建方法表示為:
Rpre(xw/2,yw/2,Tpre)=T1R1(xw/2,yw/2,T1)+
T2R2(xw/2,yw/2,T2).
(2)
式中:Rpre為預(yù)測時相Tpre的高分辨率融合數(shù)據(jù);w為滑動窗口的大小;R1與R2分別為兩個基礎(chǔ)時相的高分辨率數(shù)據(jù);T1與T2分別為兩個基礎(chǔ)時相數(shù)據(jù)的時間權(quán)重。
2.1.3半物理融合模型
與STARFM模型相同,半物理融合模型是一種基于單數(shù)據(jù)對來實現(xiàn)數(shù)據(jù)重建的方法。其通過利用反射率參量的幾何光學(xué)模型,建立起不同尺度影像之間的相互關(guān)聯(lián),進(jìn)而準(zhǔn)確地捕捉到時相變化引起的影像變化信息。其模型的反演原理如下式:
ρ(λM,ε)=f1(λM)K+f2(λM)K+f3(λM)K.
(3)
式中:ρ(λM,ε)代表影像地表反射率;λM與ε分別是波長與視向量;f1(λM)、f2(λM)、f3(λM)表示光譜通道的模型參數(shù);K表示影像的BRDF模型核。
采用隨機(jī)森林、最大似然與支持向量機(jī)分類器分別對時序影像進(jìn)行土地利用分類,并對分類結(jié)果進(jìn)行精度評價。研究時間特征信息對分類精度變化的影響。
2.2.1隨機(jī)森林分類器
隨機(jī)森林(random forest,RF)分類器,是基于決策樹分類建立的,能夠抑制過擬合,且運行成熟迅速,適用于中分辨率影像分類。
RF分類器在運行過程中,首先讀取影像和樣本大小、地理投影、波段數(shù)等影像信息以及分類器特征信息,并將特征信息轉(zhuǎn)化成為一維向量模式輸出;之后合并所有特征信息,生成影像數(shù)據(jù)集與樣本數(shù)據(jù)集,構(gòu)建隨機(jī)森林分類器,確定決策樹個數(shù)后,對輸入影像與樣本數(shù)據(jù)集進(jìn)行分類;最后輸出的數(shù)據(jù)集寫成圖像,形成最終的分類結(jié)果。
2.2.2最大似然分類器
最大似然分類器(maximum likelihood classification,MLC),是根據(jù)最大似然比貝葉斯判決準(zhǔn)則法來建立非線性判別函數(shù)集獲得分類結(jié)果的一種方法,屬于監(jiān)督分類。MLC分類器在運行過程中,首先在確定影像的波段和特征數(shù)的基礎(chǔ)上,根據(jù)影像所屬區(qū)域具體情況,在影像上選取訓(xùn)練樣本,并進(jìn)行先驗概率求解;然后,將訓(xùn)練區(qū)以外的圖像像元逐個逐類代入概率乘法公式后,比較各類地物的歸屬概率大小,選擇最大概率值得出類別;最后根據(jù)不同像元的概率統(tǒng)計情況,生成分類結(jié)果,填充不同類別顏色構(gòu)成分類圖。
該分類器運行簡單,實施方便,其密度分布函數(shù)對于分類結(jié)果的解釋非常清晰,在多光譜影像分類領(lǐng)域應(yīng)用廣泛。
2.2.3支持向量機(jī)分類器
支持向量機(jī)(support vector machine,SVM)分類器屬于監(jiān)督分類,是一種廣義線性分類器。在遙感分類中廣泛應(yīng)用,極為可靠。
SVM分類器在分類之前,首先對影像數(shù)據(jù)進(jìn)行數(shù)值化處理,并將圖像轉(zhuǎn)化為數(shù)值信息,之后對分類特征進(jìn)行選擇,并生成特征數(shù)據(jù)集,最后從數(shù)據(jù)集中抽取部分樣本作為訓(xùn)練集,對模型進(jìn)行訓(xùn)練。在進(jìn)行分類后,SVM分類器會對懲罰項和核系數(shù)進(jìn)行優(yōu)化,進(jìn)一步提高精度后再輸出分類結(jié)果。
SVM分類器具有優(yōu)秀的泛化能力,分類速度快,結(jié)果也容易解釋。但是對輸入數(shù)據(jù)需要進(jìn)行相關(guān)處理,在分類類別增長的情況下,其所需要的計算成本會隨之呈現(xiàn)線性增長趨勢。
花生通常是經(jīng)加工后再被食用,通過加工實現(xiàn)蛋白低致敏或脫敏,也是食物過敏研究的重要方向之一[14]。Beyer K[15]等認(rèn)為,中國花生過敏人口較少的原因主要是我國常采用水煮和油炸兩種方式來加工花生,已有研究認(rèn)為熱加工主要是由于溫度的不同對花生蛋白產(chǎn)生影響,除了加工引起的蛋白質(zhì)結(jié)構(gòu)變化可以直接影響致敏性之外,聚集性和消化吸收性等其它性質(zhì)的變化也會間接影響致敏性[16]。
2.2.4影像分類處理
根據(jù)研究區(qū)生態(tài)系統(tǒng)、氣候情況以及地理地形情況的具體組成情況,參考國際IGBP分類體系標(biāo)準(zhǔn),本文將研究區(qū)地物劃分為農(nóng)田、林地、水體、人工建筑、裸地5類[13]。
樣本選取采用屏幕選擇的方法結(jié)合高分辨率遙感影像目視解譯,直接在遙感圖上選取樣本點,樣本點均為9個像元的正方形區(qū)域。確定訓(xùn)練樣本類型及數(shù)量之后,進(jìn)行樣本采集。共選擇1 350個訓(xùn)練樣本點,總計12 150個像元。對比研究區(qū)高精度土地分類圖,選擇了650個驗證樣本點。由于篇幅限制,本文僅以裸地和人工建筑為例,展示驗證樣本點位的大致分布,驗證樣本點位如圖3所示。
圖3 分類樣本點位分布圖Fig.3 Distribution of classified sample points
3.1.1時空融合結(jié)果
在融合重建過程中,以2008-07-03的高低空間分辨率數(shù)據(jù)作為STARFM模型與半物理模型的基礎(chǔ)時相數(shù)據(jù);以2008-07-03和2008-10-07的高低空間分辨率數(shù)據(jù)為ESTARFM模型基礎(chǔ)時相數(shù)據(jù),對2008年度13個時相的數(shù)據(jù)進(jìn)行了融合重建,重建結(jié)果如圖4-6所示。
圖4 STARFM融合模型重建數(shù)據(jù)Fig.4 Reconstruction data of STARFM fusion model
3.1.2融合結(jié)果分析
時空融合結(jié)果質(zhì)量評價一般分為定性評價與定量評價兩種,定性評價主要是通過目視比對與波段分布散點圖進(jìn)行評判[14]。通過目視比對,時空融合重建數(shù)據(jù)紋理特征明顯,色彩失真較少,可以應(yīng)用于后續(xù)實驗。由于重建影像數(shù)量較多,本文不再對重建影像的波段分布散點圖進(jìn)行全部列舉,僅以2008-07-27結(jié)果為例展示,具體如圖7所示。
圖7 2008-07-27重建結(jié)果定性評價散點圖Fig.7 Scatter plot of qualitative evaluation of reconstruction results on July 27,2008
定量評價是指從誤差與數(shù)據(jù)結(jié)構(gòu)相似性的角度出發(fā),對融合重建影像進(jìn)行質(zhì)量評價。其中較為重要的評價指標(biāo)有均方根誤差RMSE、結(jié)構(gòu)相似性SSIM[15]、峰值信噪比PSNR以及相對整體位數(shù)綜合誤差ERGAS.這些融合指標(biāo)中,RMSE,ERGAS指標(biāo)值越小,說明融合結(jié)果的光譜誤差越小;PSNR值越大,則表明融合結(jié)果失真程度越??;SSIM值越大,表明融合結(jié)果與真實結(jié)果匹配程度越高[16]。本文選擇PSNR,RMSE,ERGAS與SSIM作為時空融合結(jié)果的定量評價指標(biāo)。質(zhì)量評價指數(shù)值如表2所示,重建后時序影像評價指標(biāo)對比如圖8所示。
圖8 時空融合質(zhì)量評價指標(biāo)對比Fig.8 Comparison of spatial and temporal fusion quality evaluation indicators
表2 影像融合質(zhì)量評價指標(biāo)Table 2 Evaluation index of image fusion quality
圖5 ESTARFM融合模型重建數(shù)據(jù)Fig.5 Reconstruction data of ESTARFM fusion model
圖6 半物理融合模型重建數(shù)據(jù)Fig.6 Reconstruction data of semi-physical fusion model
通過分析定量評價指標(biāo)值,3種時空融合方法重建結(jié)果RMSE值均為0.01左右,ERGAS值均為20左右,表明融合影像誤差值均較低。PSNR值基本都位于20以上,SSIM值基本高于0.85,表明融合重建結(jié)果質(zhì)量較高,與真實數(shù)據(jù)具有較高相似度。ESTARFM模型在整體影像以及各波段的質(zhì)量對比中,其表現(xiàn)均優(yōu)于其他兩種模型。這表明了ESTARFM融合模型較其他兩種模型具有更好的適應(yīng)性,也證明了該模型適用于土地覆蓋異質(zhì)性較強(qiáng)區(qū)域的特點。
由表2分析可知,當(dāng)預(yù)測時相與融合基礎(chǔ)影像時間差距較小時,融合結(jié)果在評價指標(biāo)上表現(xiàn)較優(yōu);當(dāng)時間差距較大時,融合結(jié)果的質(zhì)量會相對降低。由于ESTARFM模型的起始時相為2個,所以其融合結(jié)果質(zhì)量在時間序列中具有較強(qiáng)的穩(wěn)定性。通過綜合評判,ESTARFM模型在該研究區(qū)的應(yīng)用情況最好,STARFM模型次之,半物理模型則應(yīng)用效果較差。
3.2.1分類結(jié)果
重建生成時序影像后,采用不同時空融合模型與分類器之間協(xié)同分析的方式進(jìn)行驗證研究與分類精度評定。以分析時間特征信息以及融合重建結(jié)果質(zhì)量對分類精度的影響,分類結(jié)果如圖9所示。
圖9 分類結(jié)果Fig.9 Classification results
3.2.2分類結(jié)果評價
在分類精度評價方面,采用了混淆矩陣的方法,實現(xiàn)對分類結(jié)果精度的評價驗證。通過選取驗證樣本構(gòu)建混淆矩陣,再利用混淆矩陣計算分類結(jié)果的Kappa系數(shù)與總體分類精度,以這兩個指標(biāo)值衡量分類結(jié)果精度。3種分類器對不同重建數(shù)據(jù)的分類精度指標(biāo)值如表3所示。
表3 分類結(jié)果精度評價指標(biāo)Table 3 Accuracy evaluation index of classification results
綜合分析分類結(jié)果的精度評定指標(biāo)值可得,所有分類結(jié)果的Kappa系數(shù)基本均在0.9以上,總體分類精度超過了90%,表明分類器均具有良好的精度表現(xiàn)。其中RF分類器分類效果最好,總體分類精度高出SVM分類器2%左右,高出MLC分類器4%左右。Kappa系數(shù)也具有相同的變化趨勢。
由表3中數(shù)據(jù)分析可知,在基于時序影像的分類結(jié)果中,3種分類器對不同的時序重建結(jié)果的分類精度指標(biāo)與原始數(shù)據(jù)對比均有所提高,時序影像重建對于不同分類器精度提升都具有積極作用??傮w分類精度均有1%左右的提升,Kappa系數(shù)也均提升了0.1左右。小于不同分類器的精度差值,表明時間特征的加入對精度的影響小于分類器本身。
分析比對不同時序重建數(shù)據(jù)的分類精度,3種模型重建結(jié)果與原始數(shù)據(jù)對比,分類精度均有提高。對于不同的分類器提升幅度不一樣,ESTARFM模型重建結(jié)果分類總體精度均提升了約2%,而STARFM與半物理模型總體精度提升幅度只有1.5%與1%. Kappa系數(shù)的變化規(guī)律也具有相同的趨勢。分類精度提升的大小與融合重建結(jié)果質(zhì)量高低呈正相關(guān),當(dāng)融合重建結(jié)果質(zhì)量較高時,其對分類精度提升的幅度也較大。
此外,同一地物在不同重建數(shù)據(jù)下,精度的提升幅度各不相同,以效果最好的ESTARFM模型和RF分類器組合分析,如圖10所示。不同分類器在針對ESTARFM模型重建數(shù)據(jù)進(jìn)行分類時,各類地物精度較原始數(shù)據(jù)提升幅度最高,其次為STARFM模型重建數(shù)據(jù)和半物理模型重建數(shù)據(jù)。各地物類型的精度提升幅度與整體影像有相同的變化規(guī)律,其精度提升幅度與重建數(shù)據(jù)質(zhì)量呈正相關(guān)。
圖10 各類地物分類總體精度對比Fig.10 Comparison of overall accuracy of various features classification
在基于時序影像的分類結(jié)果中,不同地物分類精度提升的幅度也有很大差別,其中提升幅度最大的是水體,由于研究區(qū)特有的氣候狀況,水體面積在不同季節(jié)變化較大。本文以效果最好的ESTARFM模型和RF分類器組合分析,各類地物不同數(shù)據(jù)的分類結(jié)果如圖11所示。在原始數(shù)據(jù)分類結(jié)果中,由于水體在該時相有干涸現(xiàn)象,其面積較小,水體中部分區(qū)域被誤分為人工建筑,而基于時序數(shù)據(jù)的分類結(jié)果中,水體面積相對較大,與實際地物表現(xiàn)情況較為接近。
圖11 分類結(jié)果細(xì)節(jié)對比Fig.11 Detail comparison of classification results
除水體外,裸地、林地和農(nóng)田的精度變化幅度也相對較大,由于季節(jié)因素的影響,植被的不同物候特征引起了植被類地物面積的變化。隨時間因素變化較小的人工建筑面積變化幅度則最小。在基于時序影像的分類結(jié)果中人工建筑面積基本沒有發(fā)生太大的改變。這說明在基于時序影像的分類中,分類精度的提升主要集中于水體類、植被類等物候特征變化明顯,受時間影響較大的地物方面。
本文通過時空融合模型,重建生成研究區(qū)年度Landsat時間序列數(shù)據(jù),采用多種分類器對時序影像進(jìn)行分類,研究了時序影像重建對不同分類器的精度影響,得到如下結(jié)論:
1) 與STARFM和半物理模型相比, ESTARFM模型表現(xiàn)出了較好的應(yīng)用效果。基于雙數(shù)據(jù)對的時空融合模型比基于單數(shù)據(jù)對的模型具有更強(qiáng)的適應(yīng)性,融合結(jié)果質(zhì)量也更高。在分類方面RF分類器的運用效果優(yōu)于MLC與SVM分類器,基于決策樹思想的RF分類器在總體精度Kappa系數(shù)上具有更優(yōu)秀的表現(xiàn)。
2) 在原始影像中加入不同重建數(shù)據(jù)的時間特征信息后,其土地覆蓋分類精度均有提升,且精度提升幅度與時空融合重建結(jié)果質(zhì)量成正相關(guān)。當(dāng)融合重建結(jié)果質(zhì)量越好時,分類精度的提升幅度越大。
3) 在基于時序影像的分類中,各分類器精度雖有提升但是幅度均不大,小于分類器之間的精度差值。表明時間特征對分類精度影響的程度小于分類器本身。不同地物類型分類精度變化幅度各不相同,時間特征對于分類精度的提升主要集中于林地和農(nóng)田等受季節(jié)影響較大的植被類地物。
對于土地覆蓋分類來說,準(zhǔn)確采集研究區(qū)多方面的特征信息,是提升分類精度的一種重要方法,但精度的提升主要還是依賴于分類器的完善與強(qiáng)化。分類器自身對于精度的影響程度大于分類特征。同時,特征信息的采集方法也會對分類精度產(chǎn)生影響,運用較為精準(zhǔn)的方法采集特征信息,是保證分類結(jié)果精度的關(guān)鍵。
在研究過程中,仍然存在一些不足。實驗中只運用了13個時相的重建數(shù)據(jù)對精度提升效果進(jìn)行分析,而重建數(shù)據(jù)的數(shù)量、所覆蓋的時間段以及研究區(qū)的地理及氣候條件也會在一定程度上對土地利用分類精度提升效果產(chǎn)生影響。因此,多源數(shù)據(jù)的引入對分類精度的影響情況也值得探討,仍然需要進(jìn)一步的實驗對結(jié)論進(jìn)行強(qiáng)化研究。