李含含,許金朵,隗曉琪,黃澤暉,馬榮華,5*
1.南京信息工程大學(xué),遙感與測(cè)繪工程學(xué)院,南京 210044
2.中國(guó)科學(xué)院南京地理與湖泊研究所,湖泊與環(huán)境國(guó)家重點(diǎn)實(shí)驗(yàn)室,南京 210008
3.國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)中心,湖泊–流域分中心,南京 210008
4.中國(guó)科學(xué)院大學(xué),北京 100049
5.草原生態(tài)安全省部共建協(xié)同創(chuàng)新中心,呼和浩特 010021
湖泊是地表極其重要的水資源,是人類活動(dòng)與發(fā)展的熱點(diǎn)區(qū)域,為流域工農(nóng)業(yè)發(fā)展和人類生活提供穩(wěn)定而清潔的水源[1],監(jiān)測(cè)湖泊水質(zhì)變化尤為重要。習(xí)近平總書記十分關(guān)心內(nèi)蒙古“一湖兩?!保ê魝惡?、烏梁素海、岱海)的生態(tài)綜合治理,而湖泊水質(zhì)的變化監(jiān)測(cè)為解決“一湖兩海”的水質(zhì)改善和環(huán)境質(zhì)量提高等問(wèn)題提供數(shù)據(jù)支撐和科學(xué)依據(jù)。呼倫湖是內(nèi)蒙古第一大湖泊,湖泊面積約為2339 km2,同時(shí)也是內(nèi)陸同緯度地帶最大的草原型湖泊[2],作為我國(guó)北方寒冷干旱地區(qū)內(nèi)陸湖泊的典型代表,在涵養(yǎng)水源、調(diào)節(jié)氣候、防風(fēng)固沙及維系呼倫貝爾草原生態(tài)系統(tǒng)平衡乃至我國(guó)北方生態(tài)安全屏障等方面發(fā)揮著不可替代的作用[3]。
懸浮物濃度作為水色參數(shù)三要素之一,影響著水體的光學(xué)特性和物質(zhì)交換,也是環(huán)境監(jiān)測(cè)的一項(xiàng)重要指標(biāo),在一定程度上能綜合反映水體的水質(zhì)特征和水體化學(xué)元素遷移、轉(zhuǎn)化和歸宿的特征和規(guī)律[4]。高懸浮物濃度會(huì)降低水體透明度,限制光在水體中的傳輸,限制水體浮游生物和沉水植被的生長(zhǎng),影響初級(jí)生產(chǎn)力,從而影響湖泊生態(tài)環(huán)境的變化[5]。因此,對(duì)懸浮物濃度進(jìn)行動(dòng)態(tài)監(jiān)測(cè)具有十分重要的意義。
傳統(tǒng)的人工巡測(cè)由于時(shí)空尺度差且耗費(fèi)巨大,難以在懸浮物濃度時(shí)空監(jiān)測(cè)上發(fā)揮有效作用。衛(wèi)星遙感具有高頻率、大范圍觀測(cè)等特點(diǎn),能夠提供同一時(shí)刻區(qū)域面狀水域的遙感影像,因此在水環(huán)境監(jiān)測(cè)中有其特有的優(yōu)勢(shì)[6]。目前遙感估算懸浮物濃度的算法主要分為兩類:經(jīng)驗(yàn)?zāi)P团c半分析模型,但針對(duì)不同水體類型的湖泊尚未有統(tǒng)一的可用模型[5]。曹志剛等(2016)[7]利用多波段組合建立模型,獲得了洪澤湖懸浮物濃度的長(zhǎng)期變化;王卷樂(lè)等(2016)[8]利用MODIS(Moderate-resolution Imaging Spectroradiometer)數(shù)據(jù)的多種光譜指數(shù),逐季建立光譜指數(shù)與懸浮物濃度的回歸關(guān)系,繼而選擇懸浮物濃度的反演模型,反演了鄱陽(yáng)湖連續(xù)多年、季相尺度的懸浮物濃度。近年來(lái),隨著計(jì)算機(jī)科學(xué)和人工智能技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)被廣泛應(yīng)用于懸浮物濃度的遙感反演中[9]。然而,多數(shù)研究集中于模型算法的研究,而很少形成長(zhǎng)期可供科學(xué)界參考和使用的公開數(shù)據(jù)集。
呼倫湖懸浮物濃度與氣候變化、人類活動(dòng)、水體富營(yíng)養(yǎng)化等因素相關(guān),懸浮物濃度數(shù)據(jù)集對(duì)呼倫湖大范圍水監(jiān)測(cè)與評(píng)估、區(qū)域研究與生態(tài)保護(hù)等具有重要意義。本研究利用機(jī)器學(xué)習(xí)模型實(shí)現(xiàn)呼倫湖懸浮物濃度的高精度反演,以此為基礎(chǔ),構(gòu)建長(zhǎng)時(shí)間、逐年月相尺度的懸浮物數(shù)據(jù)集。本數(shù)據(jù)集為掌握呼倫湖懸浮物濃度的總體時(shí)空分布、演變特征和驅(qū)動(dòng)力因素提供基礎(chǔ),為我國(guó)生態(tài)環(huán)境調(diào)查評(píng)估、區(qū)域環(huán)境管理等提供基礎(chǔ)數(shù)據(jù)。
呼倫湖地理坐標(biāo)介于116°58′–117°48′E,48°33′–49°20′N 之間,是內(nèi)蒙古第一大湖,湖面呈不規(guī)則斜長(zhǎng)方形,其湖水主要來(lái)源于海拉爾河、克魯倫河、東部烏爾遜河和東北部新開河。本研究于2016 年8 月采集了均勻分布在呼倫湖的29 個(gè)樣點(diǎn)(圖1),樣點(diǎn)位置及實(shí)測(cè)SPM 如表1。每個(gè)樣點(diǎn)使用棕色采樣瓶(2 L)采集表層至50 cm 水柱內(nèi)的混合水樣,放到裝有冰塊的保溫箱遮光保存,并于當(dāng)天做過(guò)濾處理,后置于冰箱中保存;同時(shí)記錄測(cè)量時(shí)的天氣、水體透明度、風(fēng)速、風(fēng)向、水質(zhì)狀況、采樣時(shí)間等輔助數(shù)據(jù),并使用GPS 記錄采樣位置[5]。懸浮物濃度的測(cè)量使用“稱重法”,利用450°C 烘烤過(guò)后的47 mm 的GF/F 膜過(guò)濾水樣,過(guò)濾后的膜放至烘箱105°烘烤4 小時(shí),用0.0001 g 精度的天平稱重計(jì)計(jì)算得到總懸浮物濃度[7]。
表1 實(shí)測(cè)點(diǎn)位置及SPM 濃度Table 1 The location of the measured points and SPM concentrations
圖1 呼倫湖采樣點(diǎn)分布Figure 1 Distribution of sampling sites in Hulun Lake
1.2.1 MODIS 數(shù)據(jù)下載
以MODIS(Terra:1999 年至今;Aqua:2002 年至今)為代表的中分辨率海洋水色傳感器被廣泛應(yīng)用于水質(zhì)及物候監(jiān)測(cè)[1]。MODIS 具有36 個(gè)光譜通道,分布在0.4–14 μm 的電磁波譜內(nèi),其空間分辨率為1–2 波段為250 m、3–7 波段為500 m 和8–36 波段為1000 m,可以實(shí)現(xiàn)一天覆蓋全球一次[10]。MODIS 的陸地波段(前7 個(gè)波段,光譜范圍為443–2130 nm)具有較高的空間分辨率(250–500 m)且在渾濁湖泊不飽和,故使用這7 個(gè)波段提取懸浮物濃度[1]。本文選擇從美國(guó)航空航天局海洋生物學(xué)處理組(Ocean Biology Processing Group,OBPG,https://oceandata.gsfc.nasa.gov)的數(shù)據(jù)網(wǎng)站下載呼倫湖區(qū)域2002–2021 年的MODIS Aqua Level-1A(L1A)數(shù)據(jù)。呼倫湖每年11 月至來(lái)年4 月為結(jié)冰期,因此只用5 月至10 月的遙感影像來(lái)進(jìn)行處理分析。
1.2.2 數(shù)據(jù)處理
在SeaDAS 8.1 軟件中對(duì)下載的MODIS L1A 數(shù)據(jù)進(jìn)行再處理,生成Level-1B 數(shù)據(jù),然后進(jìn)行處理以估算反射率。由于常用的水體大氣校正算法難以用于內(nèi)陸湖泊,導(dǎo)致遙感反射率(Rrs)存在較大不確定性,因此選擇從傳感器的輻射度中去除水汽和臭氧的吸收以及瑞利散射,以生成瑞利校正的反射率(Rrc,公式1)[11]。事實(shí)上,Rrc已廣泛用于監(jiān)測(cè)湖泊懸浮物濃度[12]。
使用SeaDAS 8.1 中的內(nèi)部工具,將具有相對(duì)較高空間分辨率(250–500 m)的前7 個(gè)波段(469–2130 nm)與具有500 m 空間分辨率的最后5 個(gè)波段重采樣到250 m。采用掩膜處理來(lái)去除低質(zhì)量的Rrc像素。
(1)云掩膜:在海洋水色處理中,默認(rèn)的云掩膜標(biāo)志(Rrc(859)>0.027)通常會(huì)將渾水等像素誤判而排除,造成大量數(shù)據(jù)丟失,這對(duì)呼倫湖效果尤為顯著。根據(jù)對(duì)過(guò)去研究的閾值測(cè)試,發(fā)現(xiàn)Rrc(2130)>0.021 的閾值適合于研究湖泊錯(cuò)誤!未找到引用源。,但這樣特定的閾值仍會(huì)掩蓋一些藍(lán)藻浮渣和極端渾濁的水域。
(2)陸地掩膜:呼倫湖水體變動(dòng)大,每景MODIS 數(shù)據(jù)根據(jù)歸一化差異水指數(shù)(Normalized Difference Water Index,NDWI)確定湖泊邊界,然后利用中國(guó)湖泊邊界錯(cuò)誤!未找到引用源。對(duì)提取水體進(jìn)行進(jìn)一步篩選。此外還采用浮游藻類指數(shù)(floating-algae index FAI)的閾值(即-0.004)來(lái)去除藍(lán)藻水華像元干擾。為去除陸地鄰近效應(yīng),采用了Feng 等(2018)錯(cuò)誤!未找到引用源。的方法移除近岸的4 個(gè)像素。
考慮到SPM 存在較大的時(shí)空變異性,呼倫湖的實(shí)測(cè)數(shù)據(jù)難以獨(dú)立構(gòu)建模型,因此本文使用Cao等(2023)[17]的機(jī)器學(xué)習(xí)模型從MODIS Aqua 獲取呼倫湖的懸浮物濃度。同時(shí),我們使用前文所述的29 個(gè)實(shí)測(cè)點(diǎn)對(duì)該模型在呼倫湖反演的結(jié)果進(jìn)行驗(yàn)證(詳見節(jié)3 數(shù)據(jù)質(zhì)量控制和評(píng)估)。簡(jiǎn)單而言,Cao 等(2023)的模型基于支持向量機(jī)所開發(fā),使用全國(guó)133 個(gè)湖泊采集的903 個(gè)樣點(diǎn)所構(gòu)建。模型輸入變量包括了Rrc(469), Rrc(555), Rrc(645), Rrc(859) , Rrc(1240)和三個(gè)波段比率(Rrc(555)/ Rrc(469),Rrc(645)/ Rrc(555),Rrc(859)/ Rrc(555)),輸出變量為SPM 濃度。在模型訓(xùn)練前,輸入變量進(jìn)行標(biāo)準(zhǔn)化,并歸一化到0–1 范圍;懸浮物濃度亦進(jìn)行標(biāo)準(zhǔn)化并使用log 函數(shù)進(jìn)行轉(zhuǎn)換。采用網(wǎng)格搜索法來(lái)確定支持向量機(jī)的參數(shù),最終獲得懸浮物反演模型。模型的主要參數(shù)如表2 所示。更多的細(xì)節(jié)參考Cao 等(2023)[17]。
表2 用于估算SPM 的支持向量機(jī)回歸模型參數(shù)Table 2 Hyperparameters for the support vector regression model to estimate SPM
基于上述SPM 反演模型完成2002–2021 年間的呼倫湖懸浮物濃度反演,形成年均濃度分布數(shù)據(jù)集(圖2)和月均濃度分布數(shù)據(jù)集(圖3)。總體上,呼倫湖的懸浮物濃度較高(平均值53.6 mg/L,標(biāo)準(zhǔn)差為7.95 mg/L),表明呼倫湖水體較為渾濁。從空間分布上看,呼倫湖懸浮物濃度西南部比東北部變化明顯,最大值、最小值均在西南部。在人類活動(dòng)、社會(huì)因素和自然因素的影響下,在2002年至2021 年期間,懸浮物濃度整體呈先上升后下降的趨勢(shì),其中2006–2013 年較高,自2014 年逐步下降。2006 年為補(bǔ)充呼倫湖水量,從海拉爾河引水,外源的輸入增加,因此2006–2013 年懸浮物濃度維持較高狀態(tài)。2014 年以來(lái)懸浮物濃度下降與風(fēng)速的下降和流域的植被恢復(fù)有關(guān)。
圖2 2002–2021 年呼倫湖年均懸浮物濃度空間分布Figure 2 Spatial distribution of annual mean suspended matter concentration in Hulun Lake from 2002 to 2021
圖3 2002–2021 年呼倫湖月均懸浮物濃度空間分布Figure 3 Spatial distribution of monthly mean suspended matter concentration in Hulun Lake from 2002 to 2021
在季節(jié)上,呼倫湖的懸浮物濃度7 月最低(平均值37.7 mg/L,標(biāo)準(zhǔn)差為6.95 mg/L),10 月最高(平均值74.9 mg/L,標(biāo)準(zhǔn)差為13.20 mg/L),這是因?yàn)楹魝惡闇\水湖泊(平均水深為5.7m),風(fēng)速引起的底泥再懸浮作用是懸浮物濃度季節(jié)變化的主要原因[7]。呼倫湖秋季風(fēng)速較高,因此在9 月和10 月具備較高的濃度。
將MODIS 遙感數(shù)據(jù)反演的懸浮物濃度與樣點(diǎn)實(shí)測(cè)值進(jìn)行結(jié)果驗(yàn)證,以保證各期模型在遙感數(shù)據(jù)上應(yīng)用的有效性。主要采用決定系數(shù)(R2)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)驗(yàn)證,計(jì)算方法如下。
其中N表示用于計(jì)算的數(shù)據(jù)個(gè)數(shù),i代表數(shù)據(jù)的下標(biāo),X和Y則分別代表用于評(píng)價(jià)的數(shù)據(jù)變量。
將Cao 等(2023)[17]模型應(yīng)用于呼倫湖獲取SPM 濃度。利用29 個(gè)實(shí)測(cè)點(diǎn)的位置提取SPM,與實(shí)測(cè)SPM 濃度對(duì)比評(píng)價(jià)模型的精度。結(jié)果發(fā)現(xiàn)該模型在實(shí)測(cè)樣點(diǎn)的精度較高(R2=0.71,RMSE 為9.6 mg/L,MAPE=16.5%)(圖4),在呼倫湖表現(xiàn)較好。鑒于模型在呼倫湖的相對(duì)誤差低于35%,高于業(yè)內(nèi)對(duì)水色產(chǎn)品算法的精度要求錯(cuò)誤!未找到引用源。,故可用該模型對(duì)呼倫湖懸浮物濃度進(jìn)行遙感反演估算。雖然本次覆蓋了SPM 濃度20–80 mg/L 的范圍,具有一定代表性;但是,可能未覆蓋其他季節(jié)的極端情況,因此未來(lái)我們也將增加更多呼倫湖實(shí)測(cè)數(shù)據(jù)進(jìn)一步驗(yàn)證或優(yōu)化模型。
圖4 支持向量機(jī)模型精度驗(yàn)證圖Figure 4 Accuracy verification diagram of the support vector machine model
本數(shù)據(jù)集是基于支持向量機(jī)和星地同步數(shù)據(jù)構(gòu)建的模型反演結(jié)果,其精度滿足要求。本數(shù)據(jù)集實(shí)體解壓后的tif 數(shù)據(jù)可使用專業(yè)的GIS 軟件打開和編輯再加工;其時(shí)間序列涵蓋了2002–2021 年的呼倫湖懸浮物濃度的時(shí)空分布信息,可為呼倫湖大范圍水監(jiān)測(cè)和評(píng)估、生態(tài)保護(hù)等提供參考與數(shù)據(jù)支持。
致 謝
感謝美國(guó)航空航天局(NASA)提供MODIS 數(shù)據(jù)和處理支持,感謝湖泊–流域數(shù)據(jù)中心提供實(shí)測(cè)數(shù)據(jù)構(gòu)建模型。
數(shù)據(jù)作者分工職責(zé)
李含含(1997—),女,河南開封市人,碩士生,研究方向?yàn)閼腋∥餄舛冗b感監(jiān)測(cè)。主要承擔(dān)工作:方案設(shè)計(jì)與實(shí)施,論文撰寫,數(shù)據(jù)處理。
許金朵(1982—),女,江蘇省睢寧縣人,碩士,工程師,研究方向?yàn)閿?shù)據(jù)庫(kù)建設(shè)、數(shù)據(jù)共享與地理信息系統(tǒng)。主要承擔(dān)工作:數(shù)據(jù)準(zhǔn)備,數(shù)據(jù)整理與上傳。
隗曉琪(2000—),女,陜西省西安市人,碩士生,研究方向?yàn)楹垂逃泄鈱W(xué)特性的遙感反演。主要承擔(dān)工作:遙感數(shù)據(jù)預(yù)處理,數(shù)據(jù)產(chǎn)品質(zhì)量控制。
黃澤暉(1999—),男,河南省洛陽(yáng)市人,碩士生,研究方向?yàn)楹此{(lán)藻水華的遙感監(jiān)測(cè)。主要承擔(dān)工作:實(shí)測(cè)數(shù)據(jù)采集與分析處理。
馬榮華(1972—),男,山東臨沂市人,博士,研究員,研究領(lǐng)域?yàn)楹喘h(huán)境遙感、湖泊-流域數(shù)據(jù)共享。主要承擔(dān)工作:論文修改完善,數(shù)據(jù)方法指導(dǎo)。
中國(guó)科學(xué)數(shù)據(jù)(中英文網(wǎng)絡(luò)版)2023年4期