張永宏 陳帥 王劍庚 朱靈龍 陳詩偉
摘要
目前應(yīng)用最為廣泛的積雪覆蓋區(qū)域圖(SCA)可由中分辨率成像光譜儀(MODIS)獲取,常被用于積雪覆蓋時(shí)空變化的研究中.由于受云遮擋的影響,MODIS積雪產(chǎn)品存在較大區(qū)域的數(shù)據(jù)缺失.為了消除云遮擋的影響,本文構(gòu)建一種降噪自編碼神經(jīng)網(wǎng)絡(luò)模型,建立雪粒徑與復(fù)雜地形、土地覆蓋類型之間的復(fù)雜的映射關(guān)系,實(shí)現(xiàn)云下積雪參數(shù)的補(bǔ)全,提高積雪產(chǎn)品的覆蓋面積.本文選取開都河流域?yàn)檠芯繀^(qū)域,將MODIS反演得到的積雪產(chǎn)品數(shù)據(jù)與地形地物數(shù)據(jù)結(jié)合,并通過降噪自編碼神經(jīng)網(wǎng)絡(luò)(Denoising Autoencoder Artificial Neural Network)、極值雪線法相結(jié)合的方法來定量地回歸補(bǔ)全高山復(fù)雜地形下由于云覆蓋導(dǎo)致的積雪缺失數(shù)據(jù),從而得到無缺失的逐日雪蓋數(shù)據(jù).其中,降噪自編碼神經(jīng)網(wǎng)絡(luò)融合多特征數(shù)據(jù),建立地形特征與雪粒徑數(shù)據(jù)之間的非線性映射關(guān)系,從而來補(bǔ)全云層下的雪粒徑數(shù)據(jù);極值雪線法主要用來去除低海拔地區(qū)誤報(bào)值,進(jìn)一步提高雪蓋提取精度.采用MODIS積雪產(chǎn)品對(duì)去云結(jié)果開展精度驗(yàn)證,本文所提出的去云方法的精度超過86%,有效地提高了雪蓋提取精度.因此,本文所提的算法可以有效地去除復(fù)雜地形區(qū)域的云覆蓋.
關(guān)鍵詞降噪自編碼神經(jīng)網(wǎng)絡(luò);極值雪線法;復(fù)雜地形;去云
中圖分類號(hào)
P426.63+5;P407.8
文獻(xiàn)標(biāo)志碼
A
收稿日期
2021-06-10
資助項(xiàng)目
國家自然科學(xué)基金(41875027,41871238)
作者簡介張永宏,男,博士,教授,主要從事大氣遙感檢測(cè)、圖像處理分析研究.zyh@nuist.edu.cn
0 引言
作為現(xiàn)代氣候系統(tǒng)的五大圈層之一的冰凍圈,其中的積雪分布最為廣泛,并且是高海拔地區(qū)農(nóng)田灌溉以及居民生活的主要用水來源[1-2],過量的積雪也會(huì)引發(fā)積雪災(zāi)害[3].新疆作為我國冰雪儲(chǔ)存量最為豐富的地區(qū),其積雪的儲(chǔ)存量位居全國之首,約占全國積雪資源的三分之一[4].而位于新疆天山南坡的開都河流域,是山間盆地的典型區(qū)域,冰雪融水與降水是當(dāng)?shù)氐闹饕Y源補(bǔ)給,其中積雪的變化直接影響著開都河流域的徑流變化[5].
為了獲取開都河流域長時(shí)間、大范圍的積雪覆蓋信息,中分辨率成像光譜儀(Moderate-resolution Imaging Spectroradiometer,MODIS)積雪產(chǎn)品逐步得到應(yīng)用,對(duì)于該儀器的諸多研究[6-7]表明MODIS數(shù)據(jù)在探測(cè)積雪信息方面具有很強(qiáng)的能力.衛(wèi)星遙感所提供的多尺度、長時(shí)間序列、高空間分辨率且時(shí)間連續(xù)的衛(wèi)星數(shù)據(jù),對(duì)于定量、定性監(jiān)測(cè)積雪信息與變化具有重要且積極的作用.但同時(shí),MODIS作為一顆光學(xué)衛(wèi)星,云遮擋限制了該產(chǎn)品的使用.諸多科研人員對(duì)積雪影像中的云像元去除進(jìn)行了大量的研究,可以概括為:多傳感器融合法、時(shí)間或空間過濾法、模型驅(qū)動(dòng)法[8].
多傳感器融合的去云方法融合光學(xué)遙感數(shù)據(jù)與微波遙感數(shù)據(jù),利用微波對(duì)云的穿透性,實(shí)現(xiàn)對(duì)云層下積雪信息進(jìn)行獲?。?-11].時(shí)間或空間過濾法是另一種常用的去云方法.時(shí)間與空間過濾法可以單獨(dú)使用,但通常綜合使用來達(dá)到更佳的去云效果[12-15].然而這些方法在積雪積累期,山地的云覆蓋持續(xù)時(shí)間較長,去云精度降低,并且受季節(jié)、地形特性等環(huán)境因素影響.
模型驅(qū)動(dòng)法主要依賴于建立積雪與其他環(huán)境因素之間的關(guān)系模型.Jain等[16]探討了喜馬拉雅地區(qū)積雪與海拔高度之間的相互關(guān)系,對(duì)積雪覆蓋面積(SCA)與積雪持續(xù)時(shí)間(SCD)進(jìn)行估計(jì),得到積雪覆蓋面積與積雪持續(xù)時(shí)間隨海拔的變化趨勢(shì).Kour等[17]評(píng)估了喜馬拉雅山西部奇納布河盆地的積雪覆蓋面積百分比與海拔、坡度以及坡向之間的關(guān)系,結(jié)果顯示積雪覆蓋面積百分比與地形之間存在著密切的關(guān)系.侯海艷等[18]將新疆北部地區(qū)觀測(cè)資料建立人工神經(jīng)網(wǎng)絡(luò),通過優(yōu)選模型較為合理地估算了北疆地區(qū)的積雪深度信息.
本研究提出降噪自編碼神經(jīng)網(wǎng)絡(luò)與極值雪線相結(jié)合的方法對(duì)MODIS積雪數(shù)據(jù)中的云覆蓋像元進(jìn)行去除.
本文以MODIS數(shù)據(jù)反演所得的積雪產(chǎn)品為研究對(duì)象,采用回歸模型從定量角度對(duì)積雪信息進(jìn)行分析估計(jì),從而從積雪數(shù)據(jù)中去除云覆蓋像元,并生成研究區(qū)域的逐日連續(xù)的積雪覆蓋數(shù)據(jù).
1 研究區(qū)域概況
如圖1所示,研究區(qū)域位于新疆天山南坡的開都河流域(82.94°~86.02°E,42.19°~43.35°N).天山地區(qū)的降水主要受西風(fēng)氣流和北冰洋氣流的水汽影響,開都河也是我國最長的內(nèi)陸河流——塔里木河的四大主要源流之一,屬于暖溫帶大陸性干旱氣候[19].
開都河流域北高南低,地形復(fù)雜,流域上游段海拔高度一般在3 000 m以上,區(qū)域內(nèi)最高山峰為克勒代烏拉,海拔4 679 m.海拔3 600 m以上地域常年積雪,地形以山脈為主,且地勢(shì)險(xiǎn)峻、人煙罕至、積雪零碎,該區(qū)域內(nèi)觀測(cè)站稀少[20].在開都河流域腹地,衛(wèi)星數(shù)據(jù)反演的精度相對(duì)較低,且在云遮擋情況下由于缺少地面站數(shù)據(jù)而導(dǎo)致驗(yàn)證困難.所以本文基于衛(wèi)星遙感數(shù)據(jù)利用神經(jīng)網(wǎng)絡(luò)的方法,對(duì)氣象要素以及地形參數(shù)進(jìn)行聯(lián)合訓(xùn)練來估計(jì)缺失的積雪信息,以期有效地減少衛(wèi)星遙感影像中的云干擾,研制無云或少云的雪蓋數(shù)據(jù).
2 數(shù)據(jù)來源
2.1 雪粒徑數(shù)據(jù)
雪粒徑是描述積雪微觀物理性質(zhì)的一項(xiàng)重要參數(shù),其時(shí)空分布作為融雪徑流模型、雪化學(xué)模型以及氣候模型的輸入?yún)?shù),對(duì)融雪進(jìn)行評(píng)估具有重要意義[21].本研究主要以反演所得積雪產(chǎn)品作為研究對(duì)象,基于量化積雪數(shù)據(jù)進(jìn)行模型搭建,估計(jì)被云遮擋的雪粒徑數(shù)值,從而達(dá)到對(duì)積雪產(chǎn)品的去云處理效果.許多研究表明,基于MODIS 500 m分辨率數(shù)據(jù)能夠較理想地模擬雪粒徑[22-24].本文所選用的數(shù)據(jù)包括2000—2020年空間分辨率為500 m的MODIS反演得到的逐日雪粒徑原始數(shù)據(jù)[25],數(shù)據(jù)相關(guān)參數(shù)如表1所示.
2.2 數(shù)字高程數(shù)據(jù)
數(shù)字高程模型(Digital Elevation Model,DEM),是地表地貌信息的數(shù)字化表達(dá),利用DEM作為輸入數(shù)據(jù)源,是實(shí)現(xiàn)積雪識(shí)別的一種有效的方法[26].積雪日數(shù)和DEM之間存在著明顯的正相關(guān)關(guān)系,積雪的空間分布變化受海拔高度差異因素的影響[27].本文所使用的是來源于地理空間數(shù)據(jù)云的ASTER GDEM V2數(shù)據(jù)集.通過Arcgis軟件對(duì)其進(jìn)行數(shù)據(jù)預(yù)處理,包括對(duì)原始DEM數(shù)據(jù)進(jìn)行鑲嵌、投影,按照所研究開都河流域的矢量圖進(jìn)行裁剪處理,同時(shí)采用雙線性插值方法將裁剪所得的DEM數(shù)據(jù)的空間分辨率由30 m上采樣為500 m,最后得到分辨率為500 m的開都河流域DEM數(shù)據(jù).
2.3 土地覆蓋類型數(shù)據(jù)
雪粒徑在時(shí)空關(guān)系上的變化與氣象條件、下墊面性質(zhì)密切相關(guān).采用MODIS衛(wèi)星反射率數(shù)據(jù)的監(jiān)督分類得到的土地覆蓋類型產(chǎn)品(Land Cover data)MCD12Q1地物數(shù)據(jù),其為分辨率500 m的土地覆蓋類型描述數(shù)據(jù),共包含17個(gè)土地覆蓋類型.研究區(qū)植被多為旱生植物,且植被種類較多[28],主要以草地為主,在盆地平原存在較大面積濕地,在高海拔山嶺主要分布大量的雪和冰.
3 研究方法
3.1 基于極值雪線法的高程濾波模型
為了減少本文降噪自編碼神經(jīng)網(wǎng)絡(luò)回歸模型對(duì)較低海拔分類誤差較大的后果,采用極值雪線法進(jìn)行處理.在高山地區(qū),海拔通常被認(rèn)為是雪蓋分布的主導(dǎo)因素[29],而極值雪線法正是通過對(duì)無云像元的海拔信息對(duì)云覆蓋進(jìn)行剔除的.
雪線法通?;谧钚》e雪像元的海拔作為陸地線,最大積雪像元的海拔作為雪線.處理時(shí)將低于陸地線海拔地區(qū)的云覆蓋分類為陸地,將高于雪線海拔地區(qū)的云覆蓋分類為雪蓋,而位于陸地線與雪線之間范圍的云覆蓋不進(jìn)行分類[30].雪線法去除精度相對(duì)較高,但是,雪線法的除云精度會(huì)隨著云覆蓋比例的增加而降低[31].除此之外,區(qū)域雪線法也常用于去除一定海拔范圍內(nèi)的云覆蓋,該方法中的陸地線和雪線是由所有陸地像元以及所有積雪像元海拔高度的平均獲得[32],相較于極值雪線法,該方法不適用于本研究區(qū)域,因?yàn)榫笛┚€法極易受到高海拔與低海拔地區(qū)無云像元的影像,從而使結(jié)果精度大大降低.極值雪線法公式如下:
S(x,y,t)=0, H(x,y) 式中:S(x,y,t)為當(dāng)天(t)的x,y位置上像元的積雪覆蓋,即S(x,y,t)=0 時(shí)為陸地;H(x,y) 為x,y位置上像元的海拔高度;H min(t) 為當(dāng)天(t)的陸地線閾值,即積雪覆蓋像元的最低海拔高度.考慮到本研究地區(qū)主要位于高海拔地帶,為了減少對(duì)高海拔的雪數(shù)據(jù)缺失像元誤分類為積雪,對(duì)雪線則設(shè)定為最高海拔.本文的方法是找到雪覆蓋的最低海拔高度,即設(shè)定為當(dāng)前單景數(shù)據(jù)的陸地線. 3.2 基于降噪自編碼神經(jīng)網(wǎng)絡(luò)的雪粒徑回歸模型 降噪自編碼神經(jīng)網(wǎng)絡(luò)是一種無監(jiān)督的前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模型[33],其輸出是輸入的非線性映射,并且能夠?qū)?shù)據(jù)的深層特征進(jìn)行自動(dòng)提取,實(shí)現(xiàn)數(shù)據(jù)特征降維處理以及自主學(xué)習(xí)特征映射關(guān)系[34].自編碼神經(jīng)網(wǎng)絡(luò)具有三層結(jié)構(gòu),分別是輸入層、隱藏層和輸出層.第一層包含4個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)均與每個(gè)輸入相連;以此類推,下一層與上一層相連.由輸入層到隱藏層是編碼過程,其將輸入x(t)映射到隱空間,即編碼為 h=δ(Wx+b).(2) 由隱藏層到輸出層是解碼過程,解碼過程是將潛在向量x作為輸入從低維空間中重建輸入,即解碼為 =δ′(W′x+b′),(3) 式中:δ,δ′ 分別為編碼與解碼過程的激活函數(shù);W,W′ 分別為編碼與解碼過程的權(quán)重;b,b′ 為解碼過程的偏置;x作為輸入, 是解碼的輸出,可以認(rèn)為是輸入x的預(yù)測(cè)值.根據(jù)經(jīng)驗(yàn)與輸入數(shù)據(jù)特點(diǎn),本文采用Relu激活函數(shù),相較于Sigmoid激活函數(shù)收斂速度更快,使神經(jīng)網(wǎng)絡(luò)具備了非線性特征學(xué)習(xí)能力.本文降噪自編碼神經(jīng)網(wǎng)絡(luò)模型包括多特征數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)兩個(gè)主要部分,基本結(jié)構(gòu)如圖2所示. 采用深層自編碼器(Deep Autoencoder,DAE),在編碼器和解碼器之間堆疊更多隱藏層,網(wǎng)絡(luò)模型輸入數(shù)據(jù)包括雪粒徑、高程、坡向、坡度和地類數(shù)據(jù)樣本.從輸入到輸出的維度分別為256→128→64→128→256.自編碼器通常會(huì)學(xué)習(xí)到低維度數(shù)據(jù)信息,該低維度信息通??梢蕴峁└玫妮斎氡硎荆?5],進(jìn)行特征選擇和特征提取,去掉數(shù)據(jù)集中夾雜的噪聲,在相對(duì)較小的數(shù)據(jù)集上有較高的魯棒性[36].同時(shí)為了防止模型過擬合,將模型的dropout參數(shù)設(shè)置為0.4,這可以通過阻止神經(jīng)元的激活狀態(tài)來提高神經(jīng)網(wǎng)絡(luò)的性能[37].模型訓(xùn)練參數(shù)的批處理大小為1 000,最大訓(xùn)練次數(shù)為200個(gè)Epoch.根據(jù)經(jīng)驗(yàn)選擇學(xué)習(xí)率為0.000 1,使用Adam優(yōu)化算法對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化. 對(duì)于訓(xùn)練過程中常采用的損失函數(shù)是均方根誤差(RMSE,其量值記η RMSE)、平均絕對(duì)誤差(MAE,其量值記為η MAE),各計(jì)算公式為 η RMSE=1N∑Nn=1‖x n- n‖2,(4) η MAE=1N∑Nn=1‖x n- n‖,(5) 式中:n為觀測(cè)樣本數(shù);x n 為模型的模擬值; n 為模型的真實(shí)觀測(cè)值.當(dāng)RMSE和MAE的值均為零時(shí),認(rèn)為模型的模擬性最好.通過不斷迭代訓(xùn)練自編碼神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)和更新權(quán)重矩陣和偏置向量,將給定的輸入向量x與估計(jì)向量 進(jìn)行計(jì)算比較,通過不斷迭代使損失函數(shù)達(dá)到最小化來完成神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程. 4 結(jié)果與分析 4.1 積雪產(chǎn)品去云結(jié)果 4.1.1 單景雪粒徑去云結(jié)果 為了驗(yàn)證本文方法對(duì)缺失雪粒徑數(shù)據(jù)估計(jì)效果,選擇云量較少且大范圍出現(xiàn)降雪天氣的一天進(jìn)行研究,以2018年5月25日為例.按照訓(xùn)練集80%占比以及測(cè)試集20%占比,對(duì)降噪自編碼神經(jīng)網(wǎng)絡(luò)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,訓(xùn)練過程如圖3所示. 從模型的訓(xùn)練誤差曲線與測(cè)試損失曲線可以看出,在經(jīng)過200次迭代(Epoch)訓(xùn)練后,模型的訓(xùn)練損失與測(cè)試損失達(dá)到較低且波動(dòng)較小,網(wǎng)絡(luò)達(dá)到了最佳的訓(xùn)練結(jié)果且模型收斂速度很快,說明本文的降噪自編碼神經(jīng)網(wǎng)絡(luò)能夠有效地建立多特征輸入數(shù)據(jù)與雪粒徑之間的映射關(guān)系以達(dá)到較高的去云精度.在經(jīng)過3.1節(jié)的極值雪線法處理后,將模型輸出按照預(yù)定的柵格位置信息填充到原始雪粒徑影像,如圖4所示,最終得到完整的雪粒徑數(shù)據(jù)影像. 圖4a與4b分別是雪粒徑去云前后的數(shù)據(jù)影像,其中數(shù)據(jù)包括云覆蓋(黑色)、積雪覆蓋(雪粒徑大小范圍從0~1 000 μm)以及陸地部分(綠色).與原始的MODIS雪粒徑產(chǎn)品相比,經(jīng)過本文的降噪自編碼神經(jīng)網(wǎng)絡(luò)以及極值雪線法處理后,有10.6%的缺失數(shù)據(jù)被分類為陸地,積雪的覆蓋率增加了10.15%,積雪覆蓋有了明顯增加. 為了驗(yàn)證本文所提方法的有效性,在相同數(shù)據(jù)集的情況下,分別與回歸決策樹(Classification And Regression Tree,CART)[38]、K最近鄰(K-Nearest Neighbor,KNN)[39]、隨機(jī)森林(Random Forest,RF)[40]、嶺回歸(Ridge Regression,RR)[41]以及支持向量回歸(Support Vector Regression,SVR)[42]進(jìn)行試驗(yàn)對(duì)比.表2列出了在本文所使用的相同數(shù)據(jù)集上,各種回歸模型方法的均方根誤差(RMSE)與平均絕對(duì)誤差(MAE). 從表2中的對(duì)比結(jié)果可以看出,6種方法的模型精度有所不同,其中回歸決策樹的誤差最大.因?yàn)榛貧w決策樹在模型訓(xùn)練過程中容易發(fā)生過擬合現(xiàn)象,且在進(jìn)行屬性劃分時(shí),不同的判別準(zhǔn)則會(huì)導(dǎo)致不同的屬性傾向而使精度降低.相比較其他5種機(jī)器學(xué)習(xí)方法,本文所提方法對(duì)雪粒徑數(shù)據(jù)的去云結(jié)果整體上明顯改善,且RMSE與MAE均最低.以上結(jié)果表明,本文所提出的降噪自編碼神經(jīng)網(wǎng)絡(luò)方法在對(duì)雪粒徑去云效果上優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)方法. 4.1.2 2000—2019年積雪覆蓋分析 本文選取實(shí)驗(yàn)數(shù)據(jù)時(shí),在訓(xùn)練階段按照不同數(shù)據(jù)缺失率進(jìn)行處理,訓(xùn)練集與測(cè)試集比例為8∶2.在實(shí)驗(yàn)中,模型的估計(jì)值與真實(shí)值之間的誤差越小,說明模型回歸效果越好.實(shí)驗(yàn)選取測(cè)試誤差(Test Loss)為MAE,作為主要評(píng)價(jià)指標(biāo)對(duì)模型的回歸效果進(jìn)行評(píng)價(jià),實(shí)驗(yàn)結(jié)果如圖5所示. 由實(shí)驗(yàn)結(jié)果可以看出,隨著數(shù)據(jù)量的降低,整體的測(cè)試誤差呈現(xiàn)上升趨勢(shì),在數(shù)據(jù)量為25 506及以下時(shí)訓(xùn)練階段的測(cè)試誤差過大.考慮到模型回歸結(jié)果受限于雪蓋率大小,為了提高長時(shí)間序列積雪覆蓋分析的準(zhǔn)確率,本文通過模型訓(xùn)練分析篩選積雪數(shù)據(jù)量大于25 506的單景數(shù)據(jù)進(jìn)行估計(jì)處理.由于無法獲取部分原始MODIS數(shù)據(jù),導(dǎo)致2000—2019年部分?jǐn)?shù)據(jù)缺失,缺失數(shù)據(jù)天數(shù)如表3所示. 圖6顯示了在全年雪粒徑數(shù)據(jù)基礎(chǔ)上獲得的2000—2019年積雪日數(shù)的空間分布情況(數(shù)據(jù)從2000年6月1日到2020年5月7日).為了便于對(duì)降雪進(jìn)行研究,選取一個(gè)雪年作為時(shí)間單位,即從當(dāng)年6月1日至次年5月31日. 通過對(duì)積雪產(chǎn)品去云前后雪空間分布的對(duì)比,可以看出2010年是積雪覆蓋日數(shù)最多的一年.開都河流域中部所處的天山山脈的山間盆地,即被艾爾賓山分開的兩個(gè)盆地,包括小尤爾都斯盆地、大尤爾都斯盆地,在盆地地區(qū)的積雪日數(shù)整體相對(duì)較少,盆地周圍被海拔范圍在2 500~4 000 m的山脈所環(huán)繞,而海拔較高的山脈地區(qū)的積雪日數(shù)相對(duì)較多.每年積雪日數(shù)在200 d以上的地區(qū)主要分布在北部的天山主脈的依連哈比爾尕山、中部的艾爾賓山和南部的庫魯克塔格山3 000~4 600 m的高海拔范圍. 去云雪粒徑數(shù)據(jù)集提供了包括降雪量和雪覆蓋天數(shù)在內(nèi)的不同的估計(jì)數(shù)據(jù),這對(duì)水文和氣候模型的研究具有很大的作用.為了進(jìn)一步分析開都河流域積雪覆蓋特征,對(duì)圖6中原始MODIS與去云結(jié)果進(jìn)一步研究,分別得到2000—2019年開都河流域全范圍的年最大、最小以及平均積雪日數(shù),結(jié)果如表3所示. 從表3中可以看出,本文方法在對(duì)積雪的去云處理后,年平均積雪日數(shù)有明顯增加,較原始有云MODIS數(shù)據(jù)增加了38~53 d. 對(duì)原始MODIS雪粒徑數(shù)據(jù)集與本文的去云雪粒徑數(shù)據(jù)集,在年平均積雪覆蓋范圍進(jìn)行比較,時(shí)間范圍是2000—2019年,結(jié)果表明,原始MODIS雪粒徑數(shù)據(jù)集和去云雪粒徑數(shù)據(jù)集在積雪覆蓋范圍上有很大的不同.如圖7所示,本文研究方法所得去云數(shù)據(jù)的雪覆蓋率明顯大于原始MODIS數(shù)據(jù)的雪覆蓋率,去云數(shù)據(jù)的雪覆蓋基本保持在30%~37%,而原始MODIS數(shù)據(jù)的積雪覆蓋率則僅為13%~17%.前后數(shù)據(jù)對(duì)比表明,使用本文去云雪粒徑數(shù)據(jù)集對(duì)積雪量化方面的研究具有重要的參考價(jià)值. 4.2 結(jié)果驗(yàn)證 由于開都河流域氣象站稀少,僅有一個(gè)位于天山山脈中部的巴音布魯克氣象站,來自該區(qū)域的地面觀測(cè)氣象數(shù)據(jù)有限,因此在驗(yàn)證時(shí)采用了MODIS的積雪覆蓋產(chǎn)品.本文選擇2018年觀測(cè)云量較少的 4天作為驗(yàn)證對(duì)象.在驗(yàn)證時(shí),采用本文方法對(duì)云覆蓋導(dǎo)致的積雪缺失數(shù)據(jù)進(jìn)行處理,分別從正確分類以及錯(cuò)誤分類的結(jié)果上進(jìn)行驗(yàn)證.正確分類包括積雪分類為積雪、陸地分類為陸地;錯(cuò)誤分類包括積雪分類為陸地、陸地分類為積雪.采用本文所提出的方法對(duì)所有的云覆蓋導(dǎo)致的缺失數(shù)據(jù)進(jìn)行去云補(bǔ)全處理,結(jié)果如表4所示. 圖8顯示了2000—2019年Terra衛(wèi)星MOD、Aqua衛(wèi)星MYD的雪粒徑數(shù)據(jù)的月平均積雪覆蓋率,以及采用日結(jié)合方法和本文方法之后的月平均積雪覆蓋率.原始的MODIS積雪產(chǎn)品的月平均雪蓋率與季節(jié)因素有較大的相關(guān)性,冬季的積雪覆蓋率最高而夏季的積雪覆蓋率最低.可以看出Terra衛(wèi)星MOD數(shù)據(jù)的月平均積雪覆蓋率高于Aqua衛(wèi)星MYD,主要原因是Aqua衛(wèi)星的過境時(shí)間晚于Terra衛(wèi)星,并且在白天隨著時(shí)間的推移云覆蓋在漸漸增加.本文方法相較于原始MOD數(shù)據(jù),月平均積雪覆蓋率增加了3.65%~50.35%,尤其是在11月至次年3月期間,積雪覆蓋率有明顯增加. 5 結(jié)論 本研究的目的是從原始MODIS雪粒徑產(chǎn)品中去除云覆蓋區(qū)域,以獲取開都河流域的去云積雪信息,從而提出一種適用于高山復(fù)雜地形區(qū)域的積雪去云模型.本文提出了降噪自編碼神經(jīng)網(wǎng)絡(luò)與極值雪線法相結(jié)合的模型來從MODIS積雪產(chǎn)品中去除云覆蓋,并對(duì)結(jié)果進(jìn)行了驗(yàn)證.本文主要通過 無監(jiān)督的降噪自編碼神經(jīng)網(wǎng)絡(luò)來提取地形數(shù)據(jù)中能夠映射出原始雪粒徑的抽象的特征,對(duì)訓(xùn)練過程中誤差進(jìn)行分析,模型擬合精度較高、誤差較小.同時(shí),本文使用單景數(shù)據(jù)進(jìn)行數(shù)據(jù)集劃分與模型訓(xùn)練,克服了開都河流域氣象站觀測(cè)數(shù)據(jù)受限導(dǎo)致真值標(biāo)簽不足的問題.經(jīng)過驗(yàn)證表明,與其他去云方法相比,本文方法對(duì)云覆蓋的去除效果表現(xiàn)更優(yōu),效果更加穩(wěn)?。捎帽疚姆椒ㄌ幚?000—2019年包含云覆蓋的原始MODIS積雪產(chǎn)品,即可以制作500 m空間分辨率的去云雪粒徑數(shù)據(jù).利用本文所提方法,可以估計(jì)開都河流域積雪的動(dòng)態(tài)變化,對(duì)認(rèn)識(shí)該區(qū)域積雪的長期變化具有重要的意義. 參考文獻(xiàn) References [1] Singh P,Arora M,Goel N K.Effect of climate change on runoff of a glacierized Himalayan basin[J].Hydrological Processes,2006,20(9):1979-1992 [2] Kling H,F(xiàn)ürst J,Nachtnebel H P.Seasonal,spatially distributed modelling of accumulation and melting of snow for computing runoff in a long-term,large-basin water balance model[J].Hydrological Processes,2006,20(10):2141-2156 [3] Gao J L,Huang X D,Ma X F,et al.Snow disaster early warning in pastoral areas of Qinghai province,China[J].Remote Sensing,2017,9(5):475 [4] 李良序,黃鎮(zhèn),傅華.新疆雪蓋特征分析[J].新疆氣象,2001(5):21-23 LI Liangxu,HUANG Zhen,F(xiàn)U Hua.Snow cover feature in Xinjiang[J].Bimonthly of Xinjiang Meteorology,2001(5):21-23 [5] 藍(lán)永超,鐘英君,吳素芬,等.天山南、北坡河流出山徑流對(duì)氣候變化的敏感性分析:以開都河與烏魯木齊河出山徑流為例[J].山地學(xué)報(bào),2009,27(6):712-718 LAN Yongchao,ZHONG Yingjun,WU Sufen,et al.Sensitivity of mountain runoff of rivers originated from the south slope and the north slope of the Tianshan Mountain to climate change:taking mountain runoff of Urumqi river and Kaidu river for example[J].Journal of Mountain Science,2009,27(6):712-718 [6] Parajka J,Blschl G.Validation of MODIS snow cover images over Austria[J].Hydrology and Earth System Sciences,2006,10(5):679-689 [7] Wang X W,Xie H J,Liang T G.Evaluation of MODIS snow cover and cloud mask and its application in northern Xinjiang,China[J].Remote Sensing of Environment,2008,112(4):1497-1513 [8] Tran H,Nguyen P,Ombadi M,et al.A cloud-free MODIS snow cover dataset for the contiguous United States from 2000 to 2017[J].Scientific Data,2019,6:180300 [9] Liang T G,Zhang X T,Xie H J,et al.Toward improved daily snow cover mapping with advanced combination of MODIS and AMSR-E measurements[J].Remote Sensing of Environment,2008,112(10):3750-3761 [10] Gao Y,Xie H J,Lu N,et al.Toward advanced daily cloud-free snow cover and snow water equivalent products from Terra-Aqua MODIS and Aqua AMSR-E measurements[J].Journal of Hydrology,2010,385(1/2/3/4):23-35 [11] 包慧漪,張顯峰,廖春華,等.基于MODIS與AMSR-E數(shù)據(jù)的新疆雪情參數(shù)協(xié)同反演研究[J].自然災(zāi)害學(xué)報(bào),2013,22(4):41-49 BAO Huiyi,ZHANG Xianfeng,LIAO Chunhua,et al.Co-inversion of snow parameters in Xinjiang based on MODIS and AMSR-E data[J].Journal of Natural Disasters,2013,22(4):41-49 [12] Poggio L,Gimona A.Sequence-based mapping approach to spatio-temporal snow patterns from MODIS time-series applied to Scotland[J].International Journal of Applied Earth Observation and Geoinformation,2015,34:122-135 [13] Parajka J,Pepe M,Rampini A,et al.A regional snow-line method for estimating snow cover from MODIS during cloud cover[J].Journal of Hydrology,2010,381(3/4):203-212 [14] Hall D K,Riggs G A,F(xiàn)oster J L,et al.Development and evaluation of a cloud-gap-filled MODIS daily snow-cover product[J].Remote Sensing of Environment,2010,114(3):496-503 [15] Li X H,F(xiàn)u W X,Shen H F,et al.Monitoring snow cover variability (2000-2014) in the Hengduan Mountains based on cloud-removed MODIS products with an adaptive spatio-temporal weighted method[J].Journal of Hydrology,2017,551:314-327 [16] Jain S K,Goswami A,Saraf A K.Role of elevation and aspect in snow distribution in western Himalaya[J].Water Resources Management,2009,23(1):71-83 [17] Kour R,Patel N,Krishna A P.Effects of terrain attributes on snow-cover dynamics in parts of Chenab basin,western Himalayas[J].Hydrological Sciences Journal,2016,61(10):1861-1876 [18] 侯海艷,侯金亮,黃春林,等.基于人工神經(jīng)網(wǎng)絡(luò)和AMSR2多頻微波亮溫的北疆地區(qū)雪深反演[J].遙感技術(shù)與應(yīng)用,2018,33(2):241-251 HOU Haiyan,HOU Jinliang,HUANG Chunlin,et al.Retrieve snow depth of north of Xinjiang region from ARMS2 data based on artificial neural network technology[J].Remote Sensing Technology and Application,2018,33(2):241-251 [19] 張一馳,李寶林,程維明,等.開都河流域徑流對(duì)氣候變化的響應(yīng)研究[J].資源科學(xué),2004,26(6):69-76 ZHANG Yichi,LI Baolin,CHENG Weiming,et al.Hydrological response of runoff to climate variation in Kaidu catchment[J].Resources Science,2004,26(6):69-76 [20] 楊建國,楊建偉,王振龍,等.開都河流域水文特性分析[J].水利科技與經(jīng)濟(jì),2012,18(7):10-13 YANG Jianguo,YANG Jianwei,WANG Zhenlong,et al.Hydrological characteristics of Kaidu river basin[J].Water Conservancy Science and Technology and Economy,2012,18(7):10-13 [21] 姜騰龍,趙書河,肖鵬峰,等.基于實(shí)測(cè)數(shù)據(jù)的不同雪粒徑光譜分析[J].冰川凍土,2009,31(2):227-232 JIANG Tenglong,ZHAO Shuhe,XIAO Pengfeng,et al.Spectral analysis of different snow grain sizes based on field measurement[J].Journal of Glaciology and Geocryology,2009,31(2):227-232 [22] Painter T H,Rittger K,McKenzie C,et al.Retrieval of subpixel snow covered area,grain size,and albedo from MODIS[J].Remote Sensing of Environment,2009,113(4):868-879 [23] 郭忠明,王寧練,毛瑞娟,等.基于MODIS反演祁連山七一冰川雪粒徑[J].地理科學(xué),2013,33(3):378-384 GUO Zhongming,WANG Ninglian,MAO Ruijuan,et al.Retrieved of snow grain size from MODIS over Qiyi glacier,Qilian Mountain[J].Scientia Geographica Sinica,2013,33(3):378-384 [24] 魏亞瑞,郝曉華,王建,等.基于MODIS數(shù)據(jù)的北疆積雪黑碳和雪粒徑反演及時(shí)空變化分析[J].冰川凍土,2019,41(5):1192-1204 WEI Yarui,HAO Xiaohua,WANG Jian,et al.Retrieval and analysis of spatiotemporal variation of snow black carbon and snow grain size in northern Xinjiang based on MODIS data[J].Journal of Glaciology and Geocryology,2019,41(5):1192-1204 [25] Wang J G,F(xiàn)eng X Z,Xiao P F,et al.Snow grain-size estimation over mountainous areas from MODIS imagery[J].IEEE Geoscience and Remote Sensing Letters,2018,15(1):97-101 [26] 張彥麗,張麗萍.基于Sentinel-2時(shí)序數(shù)據(jù)的山區(qū)積雪識(shí)別與面積變化[J].生態(tài)學(xué)雜志,2020,39(8):2810-2820 ZHANG Yanli,ZHANG Liping.Snow cover identification and area change in mountainous regions based on Sentinel-2 time series data[J].Chinese Journal of Ecology,2020,39(8):2810-2820 [27] 肉克亞木·艾克木,玉素甫江·如素力,瑪?shù)啬醽喬帷さ乩锵奶?博斯騰湖流域積雪的時(shí)空變化特征及其與氣候因子的關(guān)系[J].水生態(tài)學(xué)雜志,2020,41(4):9-18 ROUKEYAMU Aikemu,YUSUFUJIANG Rusuli,MADINIYATI Dilixiati.Spatiotemporal changes of snow cover in the Bosten Lake basin and its relationship with climate factors[J].Journal of Hydroecology,2020,41(4):9-18 [28] 買托合提·阿那依提,玉素甫江·如素力,麥麥提吐爾遜·艾則孜,等.新疆開都河流域主要地貌形態(tài)特征研究[J].冰川凍土,2014,36(5):1160-1166 MATOHTI Anayit,YUSUFUJIANG Rusuli,MAMATTURSUN Eziz,et al.Study of the landform features in the Kaidu River basin of Xinjiang,China[J].Journal of Glaciology and Geocryology,2014,36(5):1160-1166 [29] Tong J,Déry S J,Jackson P L.Topographic control of snow distribution in an alpine watershed of western Canada inferred from spatially-filtered MODIS snow products[J].Hydrology and Earth System Sciences,2009,13(3):319-326 [30] Gafurov A,Brdossy A.Cloud removal methodology from MODIS snow cover product[J].Hydrology and Earth System Sciences,2009,13(7):1361-1373 [31] Li X H,Jing Y H,Shen H F,et al.The recent developments in cloud removal approaches of MODIS snow cover product[J].Hydrology and Earth System Sciences,2019,23(5):2401-2416 [32] Dariane A B,Khoramian A,Santi E.Investigating spatiotemporal snow cover variability via cloud-free MODIS snow cover product in central Alborz region[J].Remote Sensing of Environment,2017,202:152-165 [33] Takaki S,Yamagishi J.A deep auto-encoder based low-dimensional feature extraction from FFT spectral envelopes for statistical parametric speech synthesis[C]//2016 IEEE International Conference on Acoustics,Speech and Signal Processing (ICASSP).March 20-25,2016,Shanghai,China.IEEE,2016:5535-5539 [34] 劉自然,李謙,顏丙生,等.堆疊稀疏自編碼深度神經(jīng)網(wǎng)絡(luò)算法及其在滾動(dòng)軸承故障診斷中的應(yīng)用[J].機(jī)床與液壓,2020,48(23):208-213 LIU Ziran,LI Qian,YAN Bingsheng,et al.Application of depth neural network algorithm with stacked sparse auto-encoder in rolling bearing fault diagnosis[J].Machine Tool & Hydraulics,2020,48(23):208-213 [35] Xu Q Y,Wu Z,Yang Y Q,et al.The difference learning of hidden layer between autoencoder and variational autoencoder[C]//2017 29th Chinese Control and Decision Conference (CCDC).May 28-30,2017,Chongqing,China.IEEE,2017:4801-4804 [36] 胡海洋,張力,李忠金.融合自編碼器和one-class SVM的異常事件檢測(cè)[J].中國圖象圖形學(xué)報(bào),2020,25(12):2614-2629 HU Haiyang,ZHANG Li,LI Zhongjin.Anomaly detection with autoencoder and one-class SVM[J].Journal of Image and Graphics,2020,25(12):2614-2629 [37] Hinton G E,Srivastava N,Krizhevsky A,et al.Improving neural networks by preventing co-adaptation of feature detectors[J].Computer Science,2012,3(4):212-223 [38] Zekic'-Suac M,Has A,Kneevic' M.Predicting energy cost of public buildings by artificial neural networks,CART,and random forest[J].Neurocomputing,2021,439:223-233 [39] Barrash S,Shen Y N,Giannakis G B.Scalable and adaptive KNN for regression over graphs[C]//2019 IEEE 8th International Workshop on Computational Advances in Multi-Sensor Adaptive Processing (CAMSAP).December 15-18,2019,Le Gosier,Guadeloupe.IEEE,2019:241-245 [40] 任家東,劉新倩,王倩,等.基于KNN離群點(diǎn)檢測(cè)和隨機(jī)森林的多層入侵檢測(cè)方法[J].計(jì)算機(jī)研究與發(fā)展,2019,56(3):566-575 REN Jiadong,LIU Xinqian,WANG Qian,et al.A multi-level intrusion detection method based on KNN outlier detection and random forests[J].Journal of Computer Research and Development,2019,56(3):566-575 [41] Rumere F O,Soemartojo S M,Widyaningsih Y.Restricted ridge regression estimator as a parameter estimation in multiple linear regression model for multicollinearity case[J].Journal of Physics:Conference Series,2021,1725:012021 [42] Al-Qatf M,Yu L S,Al-Habib M,et al.Deep learning approach combining sparse autoencoder with SVM for network intrusion detection[J].IEEE Access,2018,6:52843-52856 Cloud removal for snow products based on denoising autoencoder artificial neural network ZHANG Yonghong1 CHEN Shuai1 WANG Jiangeng2 ZHU Linglong3 CHEN Shiwei1 1School of Automation,Nanjing University of Information Science & Technology,Nanjing 210044 2School of Atmospheric Physics,Nanjing University of Information Science & Technology,Nanjing 210044 3School of Electronics & Information Engineering,Nanjing University of Information Science & Technology,Nanjing 210044 Abstract Snow cover is one of the important parameters in the study of hydrometeorology.At present,the most widely used Snow Cover Area (SCA) can be obtained by Moderate-resolution Imaging Spectroradiometer (MODIS),which is often used in the study of temporal and spatial changes of snow cover.However,large area snow data missing existed in MODIS snow cover products due to the cloud occlusion.To address this,we take the Kaidu River basin as the research region,and combine the snow product data retrieved from MODIS carried on the Terra and Aqua satellites with the topographic feature data,then use a denoising autoencoder artificial neural network and the extreme snow line method to quantitatively complement the snow data loss caused by cloud occlusion in complex alpine terrain.The denoising autoencoder artificial neural network combines multi-feature data to establish a nonlinear mapping relationship between topographic features and snow grain size,which is then used to complement the missing snow grain size data.The extreme snow line method is used to remove the false report value in low altitude area and obtain the snow cover image with high precision.In contrast verification,the accuracy of the proposed cloud removal method is over 86%,which effectively improves the snow cover detection.Therefore,the approach proposed in this paper can effectively remove cloud occlusion from snow products in complex terrain areas. Key words denoising autoencoder artificial neural network;extreme snow line method;complex terrain;cloud removal