摘要:隨著遙感技術(shù)及機器學習算法的迅速發(fā)展,光學遙感水深反演備受關(guān)注。洞庭湖水下地形變化對水運航線影響重大。以洞庭湖水運區(qū)域為例,選取隨機森林算法和中國高分一號衛(wèi)星影像開展遙感水深反演研究,并與多波段對數(shù)線性模型、BP神經(jīng)網(wǎng)絡(luò)模型和深度置信網(wǎng)絡(luò)反演效果進行對比。結(jié)果表明:隨機森林算法的反演精度高于其他模型,相關(guān)系數(shù)可達0.925。隨機森林算法和高分一號影像適用于洞庭湖區(qū)域遙感水深反演,可為洞庭湖區(qū)域性水運線路選擇提供參考。
關(guān)鍵詞:水深反演; 隨機森林; 高分一號; 洞庭湖
中圖法分類號:P237
文獻標志碼:A
DOI:10.15974/j.cnki.slsdkb.2024.09.004
文章編號:1006-0081(2024)09-0025-05
0 引 言
湖泊水深數(shù)據(jù)反映了水下地形,能計算出湖泊蓄水量變化情況,可為水運、防洪、灌溉和污染治理等提供基礎(chǔ)性資料。此外,湖泊水底地形變化可能導致水運航線變化,因此,湖泊水深數(shù)據(jù)對湖泊水運路線選擇具有重要意義。傳統(tǒng)的水深數(shù)據(jù)大都由人工實地實測獲?。?],這種方法獲取的水深數(shù)據(jù)精度相對較高,但受天氣環(huán)境、地理位置和資金成本的影響較大。遙感技術(shù)因范圍廣、不受地理條件制約和周期短的特點,其在成本和安全等因素上具有較大優(yōu)勢,現(xiàn)階段遙感技術(shù)的快速發(fā)展讓遙感水深反演備受關(guān)注[2-4]。
機器學習算法在解決非線性高復雜問題上具有優(yōu)勢,將其應(yīng)用在某些特定區(qū)域水深反演可提高反演精度[5]。朱金山等[6]采用基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型對中國南海甘泉島周邊淺海進行水深反演,精度較高;溫開祥等[7]發(fā)現(xiàn)在反演精度、效率和反演圖細節(jié)上,隨機森林(random forest,RF)模型優(yōu)于極端梯度提升(extreme gradient boosting,XGBoost)模型和SVM模型;沈蔚等[8]應(yīng)用BP神經(jīng)網(wǎng)絡(luò)模型、RF模型、梯度提升決策樹(gradient boosting decision tree,GBDT)模型及SVM模型開展水深反演實驗,發(fā)現(xiàn)RF模型與GBDT模型的淺水水深反演效果更佳。
本文采用RF模型、多波段對數(shù)線性模型、BP神經(jīng)網(wǎng)絡(luò)模型、深度置信網(wǎng)絡(luò)等方法,對洞庭湖水運區(qū)域遙感水深進行反演并分析其反演效果。
1 研究區(qū)概況
洞庭湖位于長江流域,是重要的蓄水湖泊,在洞庭湖生態(tài)經(jīng)濟中扮演著重要角色。對洞庭湖水運區(qū)域開展遙感水深反演研究,建立遙感水深反演模型,有利于及時掌握該區(qū)域水深信息,為水運及生態(tài)經(jīng)濟發(fā)展提供基礎(chǔ)性資料。本文以洞庭湖目平湖東側(cè)作為研究區(qū),該區(qū)域位于湖南省益陽市沅江市西側(cè),研究區(qū)域面積約2.7 km2,區(qū)域左側(cè)為蘆葦及農(nóng)田,右側(cè)為村莊且有一個小型貨運碼頭,船只通航頻繁,水體泥沙含量較高,相對渾濁。通過對該區(qū)域進行水深反演,一方面可探討西洞庭湖區(qū)域遙感水深反演的適用性,另一方面可為該區(qū)域水運線路選擇提供數(shù)據(jù)基礎(chǔ)。研究區(qū)位置如圖1所示。
2 數(shù)據(jù)來源及預處理
2.1 數(shù)據(jù)來源
實測水深數(shù)據(jù)采用“GNSS-RTK+單波束測深儀”的高精度組合測深系統(tǒng)施測,該方法使用高精度的聲吶設(shè)備在水下發(fā)射聲波并接收其回聲來測量水深。測量過程中,聲吶設(shè)備被安裝在穩(wěn)定平臺上,測量3次,并且取平均值作為最終的水深數(shù)據(jù)。水深數(shù)據(jù)獲取時間為2022年2月28日,根據(jù)水深數(shù)據(jù)和對應(yīng)RTK高程進行數(shù)據(jù)處理和水深改正,得到水下高程數(shù)據(jù),采用統(tǒng)計方法對誤差進行分析,計算出實測水深數(shù)據(jù)的精度在±0.1 m以內(nèi)。根據(jù)衛(wèi)星星歷文件計算出研究區(qū)影像拍攝時間為2022年3月2日,用GNSS-RTK采集該日水面高程數(shù)據(jù),最后可計算衛(wèi)星影像拍攝時對應(yīng)的水深數(shù)據(jù)。該研究區(qū)水深數(shù)據(jù)經(jīng)過處理后共獲得3 415個水深點,水深范圍為0.03~12.902 m,隨機選取總點數(shù)的60%作為訓練點,剩下的40%為測試點。最終用于模型計算的水深數(shù)據(jù)可根據(jù)水下高程數(shù)據(jù)和影像獲取當日實測水面高程進行推算。
影像數(shù)據(jù)共收集到國內(nèi)高分一號、高分二號、高分六號衛(wèi)星影像和哨兵二號衛(wèi)星影像。由于哨兵二號影像當日研究區(qū)被云霧遮擋且分辨率較低;高分二號影像獲取時間離水深數(shù)據(jù)采集時間較久,且未獲得2022年2月29日水面高程;高分六號數(shù)據(jù)中港口船只較多等原因,均對水深反演造成較大影響。由于高分一號衛(wèi)星影像數(shù)據(jù)獲取時間與水深數(shù)據(jù)采集時間僅相隔2 d,可認為水下地形變化較小,且水面船只較少,影像受干擾較小,所以選用高分一號衛(wèi)星影像作為遙感影像數(shù)據(jù)源,影像基本信息如表1所示。
高分一號衛(wèi)星搭載了2套高分相機和4套寬幅相機。為提高遙感水深反演的分辨率和精度,采用分辨率更高的PMS傳感器拍攝的影像進行水深反演。該相機傳感器參數(shù)信息如表2所示。
2.2 影像數(shù)據(jù)預處理
高分一號影像數(shù)據(jù)預處理包括全色波段數(shù)據(jù)預處理和多光譜波段數(shù)據(jù)預處理。其中,全色波段數(shù)據(jù)預處理包括輻射定標和正射校正,多光譜波段數(shù)據(jù)預處理包括輻射定標、大氣校正和正射校正,然后將處理后的多光譜影像和全色影像進行融合,得到分辨率為2 m的融合多光譜影像數(shù)據(jù),再通過遙感處理軟件即可獲取水深點對應(yīng)像素的各波段反射率。高分一號影像數(shù)據(jù)預處理流程如圖2所示。
3 研究方法
根據(jù)前人研究可知,機器學習模型反演精度要優(yōu)于傳統(tǒng)模型,而機器學習模型中RF模型反演精度在多數(shù)情況下又優(yōu)于其他模型。因此本文采用多波段對數(shù)線性模型、BP神經(jīng)網(wǎng)絡(luò)模型、RF模型、深度置信網(wǎng)絡(luò)對研究區(qū)進行遙感水深反演,各模型的輸入特征波段均采用藍、綠、紅和近紅外波段反射率,并對比分析各個模型的反演精度。
3.1 多波段對數(shù)線性模型
多波段對數(shù)線性模型是半理論半經(jīng)驗?zāi)P?,其基本思想是將多個波段的反射率取對數(shù)后構(gòu)成線性參數(shù)方程,通過訓練數(shù)據(jù),計算各項參數(shù),根據(jù)計算的參數(shù)和反射率求出其他區(qū)域水深。對數(shù)線性模型計算公式如式(1)所示。
Z=a0+∑ni=1ailn[L(λi)-L∞(λi)](1)
式中:Z為水深;a0和ai為常數(shù);L(λi)為波段i的輻亮度值;L∞(λi)為波段i在深水區(qū)輻亮度值。
3.2 BP神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò)的基本思想包含信號前向傳播和誤差前饋傳播兩個階段。BP神經(jīng)網(wǎng)絡(luò)算法流程如圖3所示。采用一層隱含層開展試驗,將實測水深數(shù)據(jù)作為輸入信號,經(jīng)過隱含層后傳輸?shù)捷敵錾窠?jīng)元,得到反演水深,當反演水深與實測水深結(jié)果不一致或相差較大時,算法將轉(zhuǎn)入誤差前饋傳播階段,隱含層根據(jù)誤差信號修改單元權(quán)重和偏置,信號前向傳播和誤差前饋傳播階段的權(quán)重修改循環(huán)持續(xù)進行,直到結(jié)果滿足要求。
通過試驗發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡(luò)模型中隱含層層數(shù)為1,隱含層節(jié)點數(shù)為8,隱含層函數(shù)選擇sigmoid,輸出函數(shù)選擇purelin時效果較好。
3.3 RF模型
RF模型是結(jié)合了集成學習理論和隨機子空間兩種方法提出來的集成式監(jiān)督學習算法,采取自助抽樣技術(shù)有放回地隨機抽取訓練樣本,形成各個決策樹的樣本子集,通過計算每個特征包含的信息,采用最優(yōu)分裂策略進行左右分裂生長,對于一個輸入的樣本,根據(jù)訓練得到的各個決策數(shù)進行迭代分枝,直至每個決策樹的葉節(jié)點,最后對各決策樹上的預測值取平均或進行投票,就可以得出此輸入數(shù)據(jù)集在整個隨機森林上的預測結(jié)果。隨機森林算法流程如圖4所示。
通過試驗發(fā)現(xiàn),隨機森林葉子的大小為5,決策樹的數(shù)量為200,決策特征變量的數(shù)目為10時效果較好。
3.4 深度置信網(wǎng)絡(luò)模型
深度置信網(wǎng)絡(luò)(deep belief networks,DBN)是一個概率生成模型,是由多個限制波爾茲曼機(restricted boltzmann machine,RBM)堆疊以及一個分類層(或回歸層)組合而成的深度網(wǎng)絡(luò)。預訓練階段自底向上,而反向微調(diào)階段自頂向下,最后達到降低誤差的目的,其原理如圖5所示。
3.5 精度評價指標
本文以平均絕對誤差MAE、均方根誤差RMSE和相關(guān)系數(shù)R共3個指標來反映模型反演效果。平均絕對誤差是所有水深點的絕對誤差的平均值,均方根誤差是所有反演水深值與實測值的偏差,這兩個指標越小,則反演效果越好;相關(guān)系數(shù)是實測水深與反演水深的皮爾森相關(guān)系數(shù)值,相關(guān)系數(shù)越大,則反演效果也越好。
MAE=∑ni=1Pi-Tin(2)
RMSE=∑ni=1(Pi-Ti)2n(3)
R=[∑ni=1(Pi-P—)(Ti-T—)]2∑ni=1(Pi-P—)2∑ni=1(Ti-T—)2(4)
式中:Pi為第i個點的反演值;Ti為第i個點的實測值;n為測試點的總數(shù);P—為測試集反演水深的平均值;T—為測試集實測水深的平均值。
4 結(jié)果分析
4.1 模型精度分析
各模型評價指標結(jié)果如表3所示。由表3可知,各模型的評價指標結(jié)果差異性較大,反演結(jié)果從優(yōu)到劣依次為RF模型gt; BP神經(jīng)網(wǎng)絡(luò)模型gt;深度置信網(wǎng)絡(luò)模型gt;多波段對數(shù)線性模型。機器學習模型的反演效果均明顯優(yōu)于傳統(tǒng)的多波段對數(shù)線性模型,效果最好的RF模型MAE僅為0.655 m,RMSE僅為1.378 m,R為0.925,表明RF模型反演精度從指標上明顯優(yōu)于其他模型。
為直觀查看模型反演精度,各模型的實測水深-反演水深點位密度圖可直觀反映點位密集程度,如圖6所示。圖中實線為y=x直線,表示實測水深和反演水深相等的曲線,離這條曲線越近,表示反演水深值與實測水深值越接近,反演效果越好。
從圖6可以看出,RF模型反演水深值更接近y=x直線,且點位更為集中。研究區(qū)水深絕大多數(shù)集中在0~3 m,部分集中在9~11 m,極少部分集中在3~9 m,這說明該研究區(qū)水深從3 m左右以極快的速度變化到9 m左右,這也導致了該區(qū)間用于機器學習的數(shù)據(jù)較少,反演精度相對較差。
4.2 水深反演
根據(jù)分析結(jié)果,選擇RF模型進行水深反演,并繪制實測水深圖和反演水深圖,如圖7所示。從實測水深圖可以看出,該研究區(qū)地形本身較為復雜,3~9 m的水深變化較快。RF模型反演水深圖與實測水深圖總體上比較接近,只是在水深變化較快處存在誤差較大的情況。
已知實測水深的精度在±0.1 m以內(nèi),可認為實測水深圖基本符合實際情況,為進一步分析反演水深效果,將反演水深圖與實測水深圖進行像素級對比,繪制反演水深-實測水深偏差圖,如圖8所示。從圖8可以看出,絕大部分偏差為-1~1 m;極少部分偏差超過±5 m,該部分集中在水深變化較快的區(qū)域;少部分偏差為1~5 m和-5~-1 m,與圖6(d)所反映的散點分布情況一致。
5 結(jié)論與展望
(1) 洞庭湖作為長江流域的重要湖泊,在水運和生態(tài)經(jīng)濟中扮演著重要角色,對其進行遙感水深反演意義重大,可為洞庭湖區(qū)域性水運線路選擇提供數(shù)據(jù)基礎(chǔ)。
(2) 機器學習算法目前已成為構(gòu)建遙感水深反演模型的主要手段,其反演精度明顯優(yōu)于傳統(tǒng)統(tǒng)計模型。
(3) 機器學習模型中RF模型水深反演效果較好,優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型和深度置信網(wǎng)絡(luò)模型,其相關(guān)系數(shù)可達0.925,可為洞庭湖其他區(qū)域遙感水深反演作為參考。
(4) 研究區(qū)水深3~9 m的地形變化較快,且該區(qū)間實測數(shù)據(jù)較少,反演精度和效果欠佳,受數(shù)據(jù)量影響,模型參數(shù)和輸入因子有待進一步改進和完善,反演精度有待進一步提升。
(5) 研究區(qū)域存在小型貨運碼頭,水體較為渾濁,且渾濁度隨時空變化存在差異,可能導致反演模型適用性降低,增加了水深反演的不確定性,因此,同區(qū)域不同水體的模型適用性有待進一步研究。
(6) 研究區(qū)范圍較小,該方法和數(shù)據(jù)是否適用于洞庭湖其他區(qū)域的水深反演有待進一步研究。今后需繼續(xù)收集與水運線路相關(guān)的水深數(shù)據(jù),完善模型參數(shù),進而應(yīng)用于洞庭湖生態(tài)經(jīng)濟、資源環(huán)境和水運交通等領(lǐng)域。
參考文獻:
[1] 賴修尉,郭亮,鄧宇.測深型側(cè)掃聲吶細物識別及淺水測量精度分析[J].水利水電快報,2022,43(增1):1-3.
[2] 王昭,白亭穎.遙感水深反演海道測量業(yè)務(wù)化應(yīng)用中的評估與思考[J].測繪通報,2024(2):129-133,139.
[3] 王照翻,馬梓程,熊忠招,等.多光譜遙感數(shù)據(jù)與多類型機器學習算法的淺海水深反演方法評價[J].熱帶地理,2023,43(9):1689-1700.
[4] 王燕茹,張利勇,劉文,等.基于高空間分辨率遙感影像的水深反演有效性評估[J].海洋學報,2023,45(3):136-146.
[5] 周彬,陳冬云,黃筱,等.基于地理信息的OED-RF草海水深反演[J].人民長江,2023,54(4):62-67.
[6] 朱金山,宋珍珍,紀軒禹,等.基于多光譜數(shù)據(jù)的南海淺水水深測量算法研究[J].測繪與空間地理信息,2019,42(1):10-13,17.
[7] 溫開祥,李勇,王華,等.基于遙感和機器學習的內(nèi)陸水體水深反演技術(shù)[J].熱帶地理,2020,40(2):314-322.
[8] 沈蔚,孟然,欒奎峰,等.4種遙感水深反演機器學習模型的比較[J].海洋測繪,2022,42(5):68-72.
(編輯:江 文)
Study on remote sensing bathymetric inversion of Dongting Lake based on GF-1 images
DAI Xin,ZHOU Wei,WANG Qian,ZOU Meifang
(The First Surveying and Mapping Institute of Hunan Province,Changsha 410114,China)
Abstract:
With the rapid development of remote sensing technology and machine learning algorithms,optical remote sensing bathymetric inversion is highly favored.The underwater topographic changes of Dongting Lake has a significant impact on water transportation routes.In this paper,we took the water near a cargo terminal in Dongting Lake as the research object,selected the Random Forest Algorithm and China's GF-1 satellite images to carry out remote sensing bathymetry inversion research,and compared the inversion effect with the multi-band log-linear model,the BP neural network model and the depth confidence network.The results showed that the inversion accuracy of Random Forest Algorithm was higher than other models,and the correlation coefficient was up to 0.925.The Random Forest Algorithm and the GF-1 satellite image were suitable for the remote sensing bathymetry inversion of the Dongting Lake region,which can provide a data basis for the selection of the regional water transportation routes in Dongting Lake.
Key words:
bathymetric inversion; Random Forest Algorithm; GF-1; Dongting Lake