章佩麗 宋亮楚 王 昱 宋小晴 古兵華
(臺州市污染防治工程技術(shù)中心,浙江 臺州 318000)
傳統(tǒng)河道監(jiān)測手段多樣,但一般監(jiān)測成本高、耗時長、同步性差[1]。遙感技術(shù)因其高效及可大面積觀測等優(yōu)勢被廣泛應(yīng)用于水質(zhì)監(jiān)測中[2]。最初的遙感水質(zhì)監(jiān)測針對的是大型水域,如MERIS、MODIS等中分辨率衛(wèi)星傳感器廣泛應(yīng)用于內(nèi)陸大型水域水質(zhì)監(jiān)測[3],隨著衛(wèi)星產(chǎn)品的不斷發(fā)展,目前逐漸使用高分辨率傳感器監(jiān)測水質(zhì),常見的遙感數(shù)據(jù)包括Landsat、Sentinel-2A等[4]。得益于遙感水質(zhì)監(jiān)測研究的不斷深入,可監(jiān)測水質(zhì)參數(shù)逐漸從水色參數(shù)擴(kuò)展到非水色參數(shù)[5]。然而,衛(wèi)星遙感技術(shù)在時間、空間和光譜分辨率之間相互矛盾,對城市河流水質(zhì)的監(jiān)測仍具有挑戰(zhàn)[6]。
隨著無人機(jī)技術(shù)的發(fā)展,配備不同類型傳感器的無人機(jī)可以獲得豐富的遙感圖像,從而成為水質(zhì)遙感的新方向[7]。尤其在水質(zhì)成分復(fù)雜的狹窄河道(如城市河流),無人機(jī)遙感技術(shù)可以實(shí)現(xiàn)水質(zhì)采樣點(diǎn)實(shí)測數(shù)據(jù)的集合,獲得豐富而全面的水質(zhì)現(xiàn)狀和空間分布信息,促進(jìn)高效、高質(zhì)量的城市河道水質(zhì)監(jiān)測和保護(hù)[8]。水質(zhì)參數(shù)的傳統(tǒng)反演模型基于遙感數(shù)據(jù)的統(tǒng)計回歸分析[9],通過波段組合尋找敏感波段作為特征變量來預(yù)測水質(zhì)參數(shù),從而獲得更好的反演結(jié)果,具體回歸方法包括線性回歸、多項式回歸、主成分分析(PCA)等[10]。劉彥君等[11]1241-1249使用無人機(jī)多光譜影像基于線性與非線性回歸模型,對浙江農(nóng)林大學(xué)東湖的總磷(TP)進(jìn)行反演,決定系數(shù)(R2)達(dá)到0.782 9;JIANG等[12]利用無人機(jī)高光譜數(shù)據(jù)采用Extra Trees回歸,構(gòu)建總氮(TN)濃度反演模型,反演得到極低的均方根誤差;CHEN等[13]將無人機(jī)多光譜影像應(yīng)用于城市河流典型河段水質(zhì)監(jiān)測,采用遺傳算法極值梯度提升法進(jìn)行建模,TP、TN反演結(jié)果的R2分別為0.699、0.787。目前,針對無人機(jī)多光譜水質(zhì)參數(shù)反演的研究多是集中于特定時間且特定研究區(qū)的水質(zhì)參數(shù)反演,鮮有報道涉及不同區(qū)域且不同時段的模型構(gòu)建。
鑒于此,本研究選取臺州市水質(zhì)差異明顯的兩條河道作為研究區(qū)域,利用無人機(jī)獲得高分辨率多光譜圖像,結(jié)合多元線性回歸算法構(gòu)建高錳酸鹽指數(shù)、TP和TN的單河道反演模型和雙河道綜合反演模型,并驗(yàn)證模型的穩(wěn)定性和適用性,嘗試構(gòu)建適用于不同河道的通用模型,研究結(jié)果可為實(shí)時診斷水體狀況提供理論基礎(chǔ)和關(guān)鍵技術(shù)。
臺州市水系發(fā)達(dá),具體細(xì)分為金清河網(wǎng)、椒北河網(wǎng)、椒江水系、三門河流、玉環(huán)河流五大水系。據(jù)《2020年臺州市水環(huán)境質(zhì)量報告》顯示,椒北河網(wǎng)水質(zhì)良好,滿足水功能要求,但金清河網(wǎng)存在不能穩(wěn)定達(dá)標(biāo)情況,因此綜合考慮臺州市水系特征后,分別于椒北河網(wǎng)、金清河網(wǎng)各選取1條河流進(jìn)行水質(zhì)監(jiān)測,分別為椒北干渠和三條河。于2021年1月18日在臺州市椒江區(qū)椒北干渠布設(shè)53個采樣點(diǎn)采集水體樣品,于2021年4月20日在臺州市路橋區(qū)三條河布設(shè)63個采樣點(diǎn)采集水體樣品,形成一個水質(zhì)多樣化的樣本集合。按照《水和廢水監(jiān)測分析方法(第四版)》規(guī)定進(jìn)行采集、運(yùn)輸、儲存和分析水樣,隨后進(jìn)行高錳酸鹽指數(shù)、TN和TP參數(shù)的測定。
相對衛(wèi)星遙感,無人機(jī)多光譜影像處理過程較為簡單,因此將獲取的多光譜數(shù)據(jù)導(dǎo)入大疆智圖軟件中進(jìn)行影像拼接,同時利用黑白板進(jìn)行輻射校正后即可得到光譜反射率數(shù)據(jù)[11]1243,將波段1至波段5的光譜反射率分別記為b1~b5。根據(jù)每個采樣點(diǎn)的經(jīng)緯度坐標(biāo),使用ArcMap 10.8提取每個采樣點(diǎn)的多光譜反射率數(shù)據(jù)。
對以往水質(zhì)遙感反演研究中使用較多的多光譜波段組合公式進(jìn)行篩選[14],選定對高錳酸鹽指數(shù)、TP和TN較為敏感的波段及波段組合進(jìn)行模型構(gòu)建,采用PCA去除異常數(shù)據(jù)后,挑選70%樣本數(shù)據(jù)作為建模集,30%作為驗(yàn)證集構(gòu)建水質(zhì)參數(shù)濃度反演模型,采用平均相對誤差(ARE)、均方根誤差(RMSE)、相對均方根誤差(rRMSE)來評價反演模型精度。
受光照、飛行速度、風(fēng)速等客觀因素影響,部分光譜數(shù)據(jù)存在異常,導(dǎo)致整體數(shù)據(jù)相關(guān)性不足,因此采用PCA對每個采樣點(diǎn)的理化特征和光譜數(shù)據(jù)整體結(jié)構(gòu)進(jìn)行探索性分析,根據(jù)95%的置信橢圓去除異常數(shù)據(jù),剩余樣本數(shù)為108。
由椒北干渠和三條河水樣的實(shí)際監(jiān)測數(shù)據(jù),兩條河流的水質(zhì)特征具有一定的差異(見圖1),但同一條河流中的高錳酸鹽指數(shù)、TP和TN的變化波動相對較小。對兩條河流水質(zhì)參數(shù)進(jìn)行Person相關(guān)性分析,結(jié)果表明椒北干渠的高錳酸鹽指數(shù)、TP和TN顯著低于三條河(P值均小于0.05)。根據(jù)《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》(GB 3838—2002),椒北干渠水質(zhì)總體優(yōu)于三條河水質(zhì),其中椒北干渠高錳酸鹽指數(shù)、TP、TN分別集中在Ⅲ類、Ⅲ類和Ⅴ類標(biāo)準(zhǔn),而三條河高錳酸鹽指數(shù)、TP、TN則分別集中在Ⅳ類、Ⅴ類和劣Ⅴ類標(biāo)準(zhǔn)。
椒北干渠和三條河對5個波段的光譜反射率均存在顯著差異(見圖2),P值均小于0.01。鑒于椒北干渠和三條河水樣水質(zhì)顯著不同,因此原始光譜反射率的顯著差異可能是由于水質(zhì)空間分布差異較大所致。
2.3.1 相關(guān)性計算
高錳酸鹽指數(shù)、TP和TN為非水色參數(shù),與單光譜反射率間的相關(guān)性一般,無法確定相關(guān)性高的敏感波段,可采用波段的和、差、比值等組合方式有效放大這些參數(shù)的光譜特征[15],因此本研究對5個波段進(jìn)行組合運(yùn)算來篩選與高錳酸鹽指數(shù)、TP及TN敏感性高的光譜特征。將水質(zhì)參數(shù)與構(gòu)建的光譜參數(shù)進(jìn)行Person相關(guān)性分析,當(dāng)P值小于0.05時,表明水質(zhì)參數(shù)與光譜參數(shù)顯著相關(guān),據(jù)此篩選出符合要求的光譜組合共23組,具體見表1。
水質(zhì)參數(shù)反演模型大多基于統(tǒng)計回歸構(gòu)建,為減少模型變量并提高模型精度,嘗試將23組光譜參數(shù)進(jìn)行PCA降維得到10個主成分,其中主成分1、2、3、4的方差貢獻(xiàn)率分別為63.2%、33.9%、1.8%、0.6%,合計能反映原始數(shù)據(jù)99.5%的信息,因此剔除主成分5~10,將主成分1、2、3、4的特征值(分別記為Z1、Z2、Z3和Z4)作為自變量,分別構(gòu)建高錳酸鹽指數(shù)、TP及TN的主成分多元線性回歸(PCA-MLR)模型。為了對比PCA-MLR模型與多元線性回歸(MLR)模型的反演效果,選取原始光譜反射率(b1~b5)作為自變量,分別構(gòu)建高錳酸鹽指數(shù)、TP及TN的MLR模型。
?呂芳上:《蔣介石:一個“繼承性創(chuàng)業(yè)者”初期人際網(wǎng)絡(luò)的建立》,載汪朝光主編《蔣介石的人際網(wǎng)絡(luò)》,社會科學(xué)文獻(xiàn)出版社2011年版,第23頁。
2.3.2 基于椒北干渠數(shù)據(jù)的單河道反演模型
根據(jù)2021年1月18日椒北干渠光譜影像和檢測數(shù)據(jù),為不同水質(zhì)參數(shù)建立單河道水質(zhì)參數(shù)遙感反演模型,模型反演精度見表2。
由表2可見,采用兩種模型對椒北干渠驗(yàn)證集數(shù)據(jù)進(jìn)行反演時,MLR模型高錳酸鹽指數(shù)、TP和TN的ARE、RMSE及rRMSE總體均小于PCA-MLR模型,說明MLR模型的反演精度優(yōu)于PCA-MLR模型;將兩種模型應(yīng)用于2021年4月20日三條河遙感影像,對照三條河實(shí)際水質(zhì)參數(shù)檢測結(jié)果進(jìn)行反演精度檢驗(yàn),僅高錳酸鹽指數(shù)的ARE為10%左右,可能兩條河流高錳酸鹽指數(shù)的濃度差別不大,但TP和TN的ARE均超過40%,RMSE及rRMSE也大幅上升,因?yàn)閮蓷l河流的TP和TN濃度差異明顯??梢?,基于椒北干渠單河道數(shù)據(jù)構(gòu)建的反演模型無法用于三條河水質(zhì)預(yù)測,缺乏適用性和通用性。
2.3.3 基于雙河道集合數(shù)據(jù)的綜合反演模型
將基于椒北干渠單河道數(shù)據(jù)構(gòu)建的反演模型應(yīng)用三條河遙感光譜反演時,由于兩條河流的污染物濃度差異明顯模型通用性差。為此,根據(jù)2021年1月18日椒北干渠和2021年4月20日三條河采樣數(shù)據(jù),建立普遍適用于雙河道水質(zhì)的綜合反演模型,模型反演精度見表3。
表1 光譜組合與高錳酸鹽指數(shù)、TP、TN的相關(guān)系數(shù)1)Table 1 Correlation coefficients between spectral composition and permanganate index,TP and TN
表2 基于單河道數(shù)據(jù)反演模型的水質(zhì)反演精度Table 2 Inversion accuracy of water quality parameters by single-river data based inversion model
總體看來,基于雙河道集合數(shù)據(jù)構(gòu)建的兩種綜合反演模型中,MLR綜合模型的反演精度優(yōu)于PCA-MLR綜合模型,與單河道反演模型結(jié)論一致??赡苁怯捎贛LR方法能夠保證原始光譜之間的差異最大化,PCA-MLR方法中光譜參數(shù)的增加反而提高了數(shù)據(jù)的冗雜性,導(dǎo)致精度降低。此外,增加三條河樣本集數(shù)據(jù)后,MLR綜合模型并未大幅降低對椒北干渠驗(yàn)證集的反演精度,但三條河驗(yàn)證集各水質(zhì)參數(shù)的ARE、RMSE及rRMSE均大幅降低,說明樣本集的增加總體可提高模型的準(zhǔn)確度。
表3 基于雙河道集合數(shù)據(jù)的綜合反演模型精度Table 3 Inversion accuracy of water quality parameters by double-river set data based comprehensive inversion model
2.4.1 反演精度驗(yàn)證
選擇基于雙河道集合數(shù)據(jù)構(gòu)建的MLR模型作為水質(zhì)參數(shù)的最終反演模型,利用32組驗(yàn)證集數(shù)據(jù)進(jìn)行高錳酸鹽指數(shù)、TP、TN實(shí)測值與模型估測值的線性擬合,結(jié)果見圖3。由圖3可見,高錳酸鹽指數(shù)擬合線的斜率為0.572,R2為0.779 2;TP擬合線的斜率為0.693 5,R2為0.788 2;TN擬合線的斜率為0.760 2,R2為0.823 2;3個水質(zhì)參數(shù)驗(yàn)證集數(shù)據(jù)點(diǎn)位總體與1∶1趨勢線貼近,說明模型估測水平較為平穩(wěn),估測值與實(shí)測值接近,可用于對臺州市部分水域的水質(zhì)參數(shù)空間分布狀況進(jìn)行估算。
2.4.2 模型估測結(jié)果分析
根據(jù)實(shí)際應(yīng)用需求,采用基于雙河道集合數(shù)據(jù)構(gòu)建的MLR模型對椒北干渠和三條河中水質(zhì)為Ⅲ類及更差水樣數(shù)量進(jìn)行估測,模型反演精度見表4。該模型對高錳酸鹽指數(shù)、TN的水質(zhì)類別反演精度較高,分別為94.4%和83.3%,TP反演精度較低,僅為61.0%,可能是因?yàn)門P不僅會受到水中浮游生物的生長繁殖影響,同時會受到懸浮物的吸附、遷移等影響,光學(xué)特征不明顯;雖然TN水質(zhì)類別反演精度高達(dá)80%以上,但21個Ⅴ類水樣中僅反演正確3個,說明本次構(gòu)建的模型具有一定局限性,只在一定TN濃度條件下適用性較強(qiáng)。
表4 水質(zhì)類別反演精度Table 4 Inversion accuracy for water quality parameters category
(1) 與PCA-MLR模型相比,MLR模型對水質(zhì)參數(shù)反演精度相對更高,可能是由于MLR方法能夠保證原始光譜之間的差異最大化,PCA-MLR方法中光譜參數(shù)的增加反而提高了數(shù)據(jù)的冗雜性,導(dǎo)致精度降低。
(2) 基于椒北干渠的單河道MLR反演模型無法用于三條河水質(zhì)預(yù)測,缺乏適用性和通用性;而基于雙河道集合數(shù)據(jù)的MLR綜合模型雖并未大幅降低對椒北干渠驗(yàn)證集的反演精度,但對三條河水質(zhì)參數(shù)的反演精度大幅提高,說明樣本集的增加總體可提高模型的準(zhǔn)確度。
(3) 為了提高模型對水質(zhì)參數(shù)的反演精度,未來可以通過對臺州市水質(zhì)特征明顯的多個河道進(jìn)行水體采樣,從而構(gòu)建更大范圍、更多區(qū)域的光譜數(shù)據(jù)樣本集,以期建立更精確、通用性更強(qiáng)的多光譜反演模型。