彭利華,盧涵宇*,袁詠儀
(1.貴州大學 大數(shù)據(jù)與信息工程學院,貴州 貴陽 550025;2.貴州六盤水三力達科技有限公司,貴州 六盤水 532001)
青藏高原作為世界上海拔最高的高原,影響著全球的生態(tài)環(huán)境和水文過程,隨著全球氣溫的升高,脆弱的青藏高原的生態(tài)環(huán)境也面臨著巨大挑戰(zhàn)[1-3]。而中國的凍土資源也主要分布在青藏高原等地區(qū),大量研究表明,近地表凍融循環(huán)影響著水文過程、地表能量平衡,以及土壤釋放氣體對溫室效應的反饋作用[3-8]。在過去的幾十年中,近地表溫度的升高促使土壤解凍時間提前,縮短了凍結期的持續(xù)時間,所以研究近地表凍融有著重要的意義。
Kim等人[6]利用特殊傳感器微波成像儀(SMM/I)的升/降軌數(shù)據(jù)評估近20年的全球近地表凍融狀態(tài),其總體的分類結果準確率大于80%。與中高頻相比,低頻L波段(1.4 GHz)對凍融檢測更具有優(yōu)勢[10]。因為L波段具有一定的穿透性,受植被覆蓋的影響更小[4,9]。來自土壤水分海洋鹽度(SMOS)[4,10]任務的L波段的被動微波數(shù)據(jù),也被證明可用于識別地表的凍融狀態(tài)[11-13]。2015年,美國國家航空航天局(NASA)發(fā)射了土壤水主被動衛(wèi)星(SMAP),任務要求生產(chǎn)準確率超過80%的全球凍融產(chǎn)品[14,15]。SMAP凍融產(chǎn)品主要采用了季節(jié)性閾值算法,該算法主要參考季節(jié)性凍結和融化狀態(tài)的特征,然后對歸一化極化率(NPR)的時間序列設定一個閾值。Zhao T等人[5]提出了另一種凍融分類的方法,用準發(fā)射率和準溫度[16]來評估土壤的狀態(tài)。其核心思想是將二維的時間序列投影到一維空間,然后利用回歸分析,計算出判別函數(shù)[5,16]。此外,張子謙等人提出一種基于離差和相對偏差的季節(jié)性閾值算法[17]。
被動微波遙感技術是研究近地表凍融循環(huán)最主要的技術之一[8,18]。其原因在于被動微波遙感受天氣影響較小、全球覆蓋范圍廣、擁有時間連續(xù)性且可持續(xù)的全天候監(jiān)測等特點[17,19]。考慮到被動微波衛(wèi)星在不同的頻率、時間和空間分辨率等條件下檢索時,凍融的分類結果會有顯著的差異。因此,本文結合SMAP輻射計L波段的被動微波數(shù)據(jù)和AMSR2輻射計Ka波段的亮溫數(shù)據(jù),提出一種基于KNN分類器的地表凍融判別分類方法,然后根據(jù)實測土壤溫度驗證分類結果和精度。
為了充分考慮不同地表覆蓋類型、復雜的氣候和水文條件,本研究選取的站點監(jiān)測網(wǎng)分別是位于青藏高原西部的阿里地區(qū)、東北部的黑河流域上游,中部和那曲站點、東部的瑪曲和南部的帕里地區(qū)。因為考慮到各站點建站時間和傳感器故障,各監(jiān)測網(wǎng)絡及站點的選取時間和基本情況如表1。本研究中的土壤溫度采取各觀測網(wǎng)內站點的平均溫度。各土壤溫濕度監(jiān)測網(wǎng)絡的位置分布情況如圖1。所有監(jiān)測網(wǎng)絡的數(shù)據(jù)來源于“國家青藏高原科學數(shù)據(jù)中心”(http://data.tpdc.ac.cn)。
圖1 各土壤溫濕度監(jiān)測網(wǎng)絡在青藏高原的位置分布Fig.1 The location distribution of various soil temperature and humidity monitoring networks on the Qinghai-Tibet Plateau
表1 各監(jiān)測網(wǎng)絡站點的具體情況Tab.1 The specific situation of each monitoring network site
阿里監(jiān)測網(wǎng)絡位于阿里地區(qū)的獅泉河市附近,安裝了16個土壤溫濕度監(jiān)測站點,本文中采用了其中的3個站點。阿里站點的平均海拔4 260~4 390 m,氣候類型為高原亞寒帶干旱氣候[7],年降雨量在75 mm左右。在本研究中采用5 cm深度的土壤溫度用于驗證。
黑河監(jiān)測網(wǎng)絡坐落于青藏高原東北部的黑河流域,黑河是中國西北地區(qū)的第二大內陸河流域,位于河西走廊中部[20]。黑河監(jiān)測網(wǎng)絡屬于高原半干旱氣候,平均海拔高度為3 694~4 187 m,年平均溫度為-4.1°,年降水量為270 mm~600 mm。
那曲監(jiān)測網(wǎng)絡部署在青藏高原腹地的那曲盆地內,地勢平坦,平均海拔高度為4 470~4 892 m。那曲網(wǎng)絡土地覆蓋以草原和苔蘚為主。在本研究中,采用的是5 cm深度的15個SMTM站點。因為這與SMAP輻射計L波段的穿透深度相當。
瑪曲監(jiān)測網(wǎng)絡[7]建立在青藏高原東端的半濕潤地區(qū),這里也是黃河的水源地之一。它覆蓋了一個被群山環(huán)繞的大山谷,海拔約3 500 m。氣候的特點是夏季多雨和溫暖,冬季干燥和寒冷。年降水量約為600 mm。景觀的特點是短草原、山谷、河流、濕地和丘陵。凍融循環(huán)過程一般出現(xiàn)在冬季和春季。
帕里網(wǎng)格建立在亞東縣帕里鎮(zhèn)周圍的平坦區(qū)域,平均海拔高度為4 270~4 579 m,年平均溫度約為-0.2℃。帕里鎮(zhèn)位于喜馬拉雅山脈的亞東河谷,該地區(qū)屬于高原山地氣候,土地覆蓋以稀疏草原和裸地為主,年降水量約380 mm。因此,植被對該地區(qū)的被動微波遙感影響較小。在帕里網(wǎng)格中,部署了21個土壤溫濕度測量(SMTM)站。在本研究中選取了單個像元內SMTM站最多的那個像元,共有8個SMTM站。
土壤水主被動任務(SMAP,Soil Moisture Active Passive)是NASA在2015年1月31日發(fā)射的環(huán)境監(jiān)測遙感衛(wèi)星。SMAP航天器位于一個685 km高度的圓形太陽同步軌道上,在當?shù)貢r間上午6點和下午6點穿越赤道,其測量系統(tǒng)由輻射計(無源)儀器和合成孔徑雷達(有源)儀器組成,它們在L波段范圍內具有多極化。SMAP的基線任務目標之一是提供北緯45°以北地區(qū)的表面二進制FT狀態(tài)估計值,整體分類精度大于80%。在本研究中使用SMAP 3級土壤水產(chǎn)品中的亮度溫度數(shù)據(jù)(L3_SM_P),可以從“美國國家冰雪中心”免費下載全球或區(qū)域不同版本的衛(wèi)星數(shù)據(jù)(https://nsidc.org/data/smap/data_versions)。
先進微波掃描輻射計(AMSR2,Advanced Microwave Scanning Radiometer-2)作為AMSR-E的繼任者,基本保持了與AMSR-E相同的參數(shù)設置,其觀測角度為55°。AMSR-2搭載于日本全球變化監(jiān)測任務(GCOM)中的水循環(huán)變化監(jiān)測衛(wèi)星上(GCOM-W)。GCOM有兩個系列的衛(wèi)星:它們分別是GCOM-W(全球水循環(huán)變化)和GCOM-C(全球氣候變化)。AMSR-2作為GCOM-W攜帶的唯一的機載任務儀器,其升軌/降軌的時間分別為當?shù)貢r間13∶30/1∶30,重訪周期約為兩天。本研究使用了AMSR-2 的Ka波(36.5 GHz)的L3級亮度溫度數(shù)據(jù),其空間分率為0.25°。為了與SMAP亮度溫度數(shù)據(jù)的空間分辨率保持一致,本研究采用線性插值的方法將AMSR2亮度溫度數(shù)據(jù)升尺度到36 km。
KNN(K-Nearest Neighbor)算法即K個最近的鄰近點,最初由 Cover和Hart于1968年提出。在模式識別領域中,KNN算法常用于分類問題和回歸的非參數(shù)統(tǒng)計。而近地表凍融的判別實際就是一個二分類問題。所謂K最近鄰,就是K個最近的鄰居的意思,指的是每個樣本都可以用它最接近的K個鄰近值來代表。KNN規(guī)則根據(jù)訓練集中的K個最近鄰中的多數(shù)標簽對每個未標記的樣本進行分類。因此,它的性能至關重要地取決于用于識別最近鄰居的距離度量。在缺乏先驗知識的情況下,大多數(shù)KNN分類器使用簡單的歐幾里得度量來度量以向量輸入表示的示例之間的差異。歐幾里得距離的定義如公式(1)所示。
(1)
式中:xi為輸入的向量之一,x=(a1,a2,…,an),在本文中是AMSR2輻射計在Ka波段處掃描得到的垂直極化亮溫;xj為準發(fā)射率(QE),準發(fā)射率為Zhao T等人[5,16]于2011年提出;wr為樣本的權重因子;本文中的準發(fā)射率是采用低頻(1.4 GHz)水平極化亮溫和高頻(36.5 GHz)垂直極化亮溫之比[23]。準發(fā)射率的計算如公式(2)所示。
(2)
式中:Tbh1.4為SMAP輻射計L波段(1.4 GHz)的水平極化亮溫;Tbv36.5為AMSR2輻射計Ka波段的垂直極化亮溫。
因為AMSR2輻射計的亮溫數(shù)據(jù)的初始空間分辨率為25 km,所以首先利用線性插值算法將AMSR2的亮溫數(shù)據(jù)升尺度到36 km,和SMAP的空間分率一致。其次,計算5個監(jiān)測網(wǎng)站點的準發(fā)射率值,結合準發(fā)射率和準溫度構建二維時間序列。然后計算待分類點到其它所有樣本點的距離,選出距離最小的K個點并比較分類。最后,根據(jù)實測監(jiān)測網(wǎng)絡的土壤溫度計算分類精度。實測土壤溫度大于或等于0℃表示土壤處于未凍結狀態(tài),當實測土壤溫度小于0℃表示土壤處于凍結狀態(tài)。
圖2 基于KNN分類器的地表凍融狀態(tài)分類流程圖Fig.2 The flow chart of surface freeze-thaw stateclassification based on KNN classifier
由于SMAP和AMSR2衛(wèi)星的過境時間的不同,因此本研究采取升軌時期的亮溫數(shù)據(jù)。具體的分類結果如圖3。所有站點的時間序列選擇的是一整年,經(jīng)歷了一個完整的凍融周期,各站點選取的具體時間如表1。對于分類精度的計算如公式(3)所示。
圖3 用KNN分類器對阿里、黑河、帕里、瑪曲、那曲監(jiān)測網(wǎng)絡的土壤凍融狀態(tài)的分類結果
(3)
式中:FF為實測土壤狀態(tài)和KNN分類的分類結果都為凍結的天數(shù);FT為實測土壤狀態(tài)為凍結,但分類器誤判土壤為融化狀態(tài);TT為實測土壤狀態(tài)和分類器的分類結果都為融化狀態(tài),TF為實測土壤狀態(tài)為融化,但分類器誤判土壤為凍結狀態(tài)的天數(shù)。
各個站點及其整體的分類精度如表2。KNN分類器對地表凍融狀態(tài)的分類精度能達到85%以上。受衛(wèi)星過境時間、重訪周期、觀測角度和空間分率等影響,單個站點的一年中的有效數(shù)據(jù)的天數(shù)不多。因此,除了用KNN分類器對5個網(wǎng)絡站點的土壤狀態(tài)進行分類外,還將5個網(wǎng)絡站點的所有數(shù)據(jù)結合起來,構建一個總體的二維時間序列數(shù)據(jù)集。結果表明總體數(shù)據(jù)集的凍融分類精度也能達到86.02%。
表2 各站點及其整體的分類精度Tab.2 Classification accuracy of each site and its overall
從圖3和圖4的分類結果來看,分類錯誤主要集中在凍結和解凍狀態(tài)交替變化的時候。這可能是因為當土壤在0℃附近時,土壤中同時含有冰和液態(tài)水,土壤的凍融狀態(tài)變化十分頻繁。此外,Ka波段的亮溫與頂層土壤的溫度高度相關,而L波段的亮溫與5 mm處的土壤溫度相關。在春夏季節(jié)交替的時候,可能頂層的土壤已經(jīng)解凍,但是5 mm深處的土壤還處于凍結狀態(tài)。與此同時,在秋冬季節(jié)交替的時候,表層的土壤已凍結,但是深層土壤(5 mm處)還處于未凍結狀態(tài)。
圖4 總體的時間序列的分類結果
季節(jié)性凍土在全球范圍內分布廣泛。本文選取了5個位于青藏高原不同位置的土壤溫濕度監(jiān)測網(wǎng)絡,用實測的土壤溫度數(shù)據(jù)驗證基于KNN分類器的地表土壤的凍融狀態(tài)。研究結果表明在非干旱地區(qū)的分類效果明顯優(yōu)于干旱地區(qū),在非干旱地區(qū)的平均準確率為95.54%,在干旱的阿里地區(qū)的準確率為88.98%。造成這種差異的原因主要是因為當土壤凍結時,土壤中的液態(tài)水含量降低導致土壤的介電常數(shù)變小,土壤的發(fā)射率變大。而干燥土壤的發(fā)射率原本就很大,再加上干燥的土壤中的液態(tài)水含量較少。因此,干旱地區(qū)的地表狀態(tài)容易被誤判為凍結土壤。此外,由于AMSR2的升軌時間為下午一點半,幾乎是一天中地表溫度最高的時候,而SMAP的升軌時間為下午18∶00。因此本文中只采用了兩顆衛(wèi)星降軌時的數(shù)據(jù)。下一步的工作將充分考慮由兩顆衛(wèi)星之間的時間差導致土壤溫度的變化,然后判別升軌時的各監(jiān)測網(wǎng)站點的土壤狀態(tài)。