朱洪波,張兵,2,劉佳典,宋偉東,2,李佳
(1.遼寧工程技術(shù)大學(xué) 測(cè)繪與地理科學(xué)學(xué)院,遼寧 阜新 123000;2.遼寧工程技術(shù)大學(xué) 地理空間信息服務(wù)協(xié)同創(chuàng)新研究院,遼寧 阜新 123000;3.大連黃渤海海洋測(cè)繪數(shù)據(jù)信息有限公司,遼寧 大連 116000)
土壤濕度是影響地表生物圈動(dòng)植物生存和發(fā)展的重要條件之一,在農(nóng)業(yè)發(fā)展、生態(tài)環(huán)境、水文循環(huán)等領(lǐng)域發(fā)揮著重要的作用[1-4]。由于土壤濕度受植被覆蓋、氣象條件、人為擾動(dòng)等因素的影響,其在分布上存在空間異質(zhì)性的特點(diǎn)。因此野外人工采樣法雖然能獲得較為精確的土壤濕度數(shù)據(jù),但難以滿足廣域范圍內(nèi)的土壤濕度監(jiān)測(cè)需要。
遙感技術(shù)的發(fā)展為大范圍、長(zhǎng)時(shí)序的土壤濕度動(dòng)態(tài)監(jiān)測(cè)提供了可能[5-7]。基于遙感影像的土壤濕度監(jiān)測(cè)方法可分為可見(jiàn)光-近紅外波段反演方法、熱紅外波段反演方法和微波波段反演方法。其中,可見(jiàn)光-近紅外波段反演方法利用不同土壤濕度條件在影像上所反映的光譜特性的不同,對(duì)土壤含水量進(jìn)行反演[8]。該方法能夠?qū)崿F(xiàn)廣域范圍內(nèi)土壤濕度的快速反演,但受天氣影響程度大且反演精度有待提升。熱紅外波段反演方法利用不同濕度的土壤其熱慣量亦不相同的特點(diǎn),通過(guò)土壤表面溫度對(duì)土壤濕度進(jìn)行反演[9]。該方法簡(jiǎn)單易行,但受地表覆被影響較大。微波穿透性強(qiáng),可實(shí)現(xiàn)全天候、全天時(shí)對(duì)地觀測(cè),按其工作原理可分為主動(dòng)微波反演和被動(dòng)微波反演兩種。主動(dòng)微波利用后向散射系數(shù)反演得到土壤含水量,而被動(dòng)微波主要是利用亮度溫度來(lái)估測(cè)土壤含水量[10]。但該方法受地表粗糙度和植被覆蓋的影響較大,精度有待提升[11]。因此,基于遙感技術(shù)的土壤濕度直接反演方法受天氣狀況、地表粗糙程度和植被覆蓋影響較大,限制了反演精度的提升。
由于土壤濕度與區(qū)域內(nèi)水域面積存在地學(xué)聯(lián)系及較強(qiáng)的相關(guān)關(guān)系,許多專家學(xué)者通過(guò)構(gòu)建水域面積與土壤濕度之間的相關(guān)關(guān)系模型間接獲取研究區(qū)的土壤濕度[12-13]。隨著深度學(xué)習(xí)的發(fā)展,基于遙感智能解譯的水域面積提取得到了較為深入的研究。全卷積網(wǎng)絡(luò)[14](fully convolutional networks,FCN)實(shí)現(xiàn)了任意尺寸圖像輸入并能獲取像素級(jí)的屬性信息。Ronneberger等[15]在FCN網(wǎng)絡(luò)基礎(chǔ)上提出了U-Net網(wǎng)絡(luò),基于編解碼思想構(gòu)建深度較淺的卷積神經(jīng)網(wǎng)絡(luò)并通過(guò)條約連接的方式將影像的高階語(yǔ)義信息與低階位置信息相結(jié)合,能夠?qū)崿F(xiàn)在小樣本條件下的目標(biāo)像素級(jí)精確提取。由于在高分辨率遙感影像中水域輪廓、顏色信息與背景差異明顯,劉佳典等[16]提出了一種基于改進(jìn)U-Net遙感影像水體提取模型,通過(guò)減少U-Net網(wǎng)絡(luò)層數(shù),實(shí)現(xiàn)水域面積的快速精確提取?;谶b感智能解譯的水域提取方法雖然能夠?qū)崿F(xiàn)水域面積的快速提取或精確提取,但仍未兼顧網(wǎng)絡(luò)模型運(yùn)算速度與提取精度之間的關(guān)系,輕量級(jí)模型在復(fù)雜影像中提取精度較深度卷積神經(jīng)網(wǎng)絡(luò)相比有待提升,深度卷積神經(jīng)網(wǎng)絡(luò)提取速度難以滿足大范圍水域提取任務(wù)的需要。
基于上述問(wèn)題,本文利用Sentinel-2多光譜影像構(gòu)建水域面積基準(zhǔn)數(shù)據(jù)集并提出一種基于圖像復(fù)雜度約束的中高分辨率水域自適應(yīng)智能提取模型,通過(guò)計(jì)算影像顏色熵并進(jìn)行閾值判斷輸入到不同網(wǎng)絡(luò)深度的改進(jìn)U-Net水域提取模型之中,實(shí)現(xiàn)研究區(qū)水域面積信息的快速精確提取,進(jìn)而基于三次多項(xiàng)式擬合方法獲取研究區(qū)土壤濕度信息。
康平地區(qū)(42°31'N~43°02'N,122°45'E~123°37'E)位于遼寧省西北部,地勢(shì)西南部為山地,海拔較高;東部為平原;北部為沙地,海拔較低??灯降貐^(qū)為溫帶大陸性季風(fēng)氣候,年降水量較多且主要集中于夏秋季節(jié)。雨熱同期為該地區(qū)農(nóng)作物生長(zhǎng)提供了有利條件,因此,康平地區(qū)的夏秋季節(jié)土壤濕度時(shí)空變化對(duì)該地的農(nóng)作物生長(zhǎng)、生態(tài)格局演變等方面具有重要意義。
研究時(shí)間為2017-2022年,采用14個(gè)時(shí)相的Sentinel-2為數(shù)據(jù)源,影像空間分辨率為10 m,數(shù)據(jù)均為水系非冰期(5-9月)云量<10%的遙感數(shù)據(jù),并對(duì)其進(jìn)行輻射定標(biāo)、幾何矯正、大氣校正[17]等預(yù)處理工作。
1)顏色熵閾值。根據(jù)顏色直方圖特性和信息論中信息熵的概念,John提出基于顏色熵表示圖像在色彩上的復(fù)雜程度,從而將圖像的顏色直方圖由多維降到一維[18]。顏色熵即為圖像中不同像素值在圖像色彩空間中的概率密度函數(shù),如式(1)所示。
(1)
式中:K為圖像的顏色數(shù)量;Pi代表了第i種顏色值在圖像中出現(xiàn)的頻率。通過(guò)顏色熵閾值的大小可以對(duì)自然圖像的顏色復(fù)雜度進(jìn)行判斷。本文依據(jù)顏色熵對(duì)遙感影像的復(fù)雜程度進(jìn)行分類,顏色熵閾值如表1所示,并將不同復(fù)雜程度的影像輸入不同深度的網(wǎng)絡(luò)模型以實(shí)現(xiàn)水域面積的自適應(yīng)提取,經(jīng)顏色熵分類后結(jié)果如表2所示。其中,經(jīng)顏色熵閾值分類為簡(jiǎn)單類型的影像多為大型面狀水域。影像中除水域部分外,背景地類較單一,導(dǎo)致水域在影像中特征較為突出,受背景干擾程度較低易于提取。復(fù)雜影像如表2右側(cè)4個(gè)圖所示,其水域多處于建筑用地之中,影像上背景顏色較多,水域特征受背景相似噪聲影響程度較大,需較深層次的網(wǎng)絡(luò)模型提取該類水域特征。
表1 基于遙感影像的顏色熵(H)分類閾值[19]
表2 不同復(fù)雜程度的Sentinal-2水體影像
2)自適應(yīng)水域提取模型。自適應(yīng)水域提取模型如圖1所示,由輸入層、圖像復(fù)雜度計(jì)算模塊、自適應(yīng)U-Net水域提取網(wǎng)絡(luò)以及輸出層組成。經(jīng)過(guò)圖像顏色熵閾值分類后的影像輸入至自適應(yīng)U-Net水域提取網(wǎng)絡(luò)之中,自適應(yīng)U-Net水域提取網(wǎng)絡(luò)基于經(jīng)典U-Net網(wǎng)絡(luò)結(jié)構(gòu)預(yù)設(shè)了兩個(gè)不同網(wǎng)絡(luò)深度的模型。由于U-Net模型編碼階段本質(zhì)上是特征提取過(guò)程,即為輸入與輸出之間的一種復(fù)雜函數(shù)映射關(guān)系,計(jì)算機(jī)能夠通過(guò)前向傳播和后向傳播在各層中調(diào)整參數(shù)并自動(dòng)學(xué)習(xí)這種映射關(guān)系,因此對(duì)卷積層的結(jié)構(gòu)進(jìn)行合理的增刪改,并不會(huì)影響網(wǎng)絡(luò)的正常運(yùn)行。U-Net模型被設(shè)計(jì)用于醫(yī)學(xué)影像分割,由于高分辨率遙感影像中部分水域特征與背景差異明顯,與醫(yī)學(xué)影像分割的復(fù)雜背景不同,使用較少的網(wǎng)絡(luò)層數(shù)也可以實(shí)現(xiàn)水域的精確提取。故本文針對(duì)水域特征與背景差異明顯、圖像顏色復(fù)雜度簡(jiǎn)單的影像,在U-Net模型的基礎(chǔ)上減去一個(gè)特征提取層及對(duì)應(yīng)的上采樣層,實(shí)現(xiàn)在保持一定精度的前提下減少模型復(fù)雜程度及運(yùn)算量,提升水體提取效率的目的。對(duì)于復(fù)雜背景影像,將其輸入至U-Net水域提取模型之中,實(shí)現(xiàn)水域面積的高精度提取。
圖1 自適應(yīng)網(wǎng)絡(luò)提取水域結(jié)構(gòu)圖
3)性能評(píng)估。為實(shí)現(xiàn)對(duì)自適應(yīng)水域提取方法的客觀評(píng)價(jià),本文以深度學(xué)習(xí)目標(biāo)提取領(lǐng)域的性能評(píng)估函數(shù)作為評(píng)價(jià)指標(biāo),對(duì)本文方法在遙感影像水域面積提取的準(zhǔn)確性及速度進(jìn)行評(píng)估。首先,為使每張檢測(cè)結(jié)果影像中水域部分與背景部分區(qū)分度達(dá)到最大,本文將自適應(yīng)水域提取方法獲取的水域影像(即檢測(cè)結(jié)果)與精細(xì)標(biāo)注的水域輪廓影像(即樣本標(biāo)簽)進(jìn)行圖像二值化處理,并將檢測(cè)結(jié)果與樣本標(biāo)簽的像素級(jí)對(duì)比結(jié)果作為評(píng)價(jià)指標(biāo)。本文采用6個(gè)性能指標(biāo)對(duì)自適應(yīng)水域提取方法進(jìn)行評(píng)價(jià)。其中,2個(gè)為關(guān)于提取速度的評(píng)價(jià)指標(biāo),即訓(xùn)練時(shí)間和預(yù)測(cè)時(shí)間;4個(gè)為關(guān)于提取精度的性能評(píng)估指標(biāo),即精確率(precision)、召回率(recall)、交并比(IoU)和F1分值(F1 Score)。其中,IoU作為圖像分割中最常用的性能評(píng)價(jià)方法之一,是模型提取出的水域像素與真值標(biāo)簽中的水域像素之間的交集與并集之比。IoU值越高,測(cè)量樣本和真實(shí)樣本之間的吻合程度越高,模型的準(zhǔn)確率也越高。精準(zhǔn)率指模型提取出的水體像素里有多少像素是真正的水體像素。召回率指真值標(biāo)簽中的水體像素有多少像素被正確提取為水體。F1是精確率和召回率的調(diào)和平均,是為了平衡精確率和召回率的影響,較為全面地評(píng)價(jià)模型。
本文利用海量Sentinel-2衛(wèi)星搭載的多光譜傳感器影像構(gòu)建水域智能提取基準(zhǔn)數(shù)據(jù)集。
由于水域面積及分布具有空間異質(zhì)性,且數(shù)據(jù)獲取時(shí)光照強(qiáng)度、影像背景復(fù)雜程度與云量的不同也會(huì)使水域在遙感影像上存在一定差異[20]。因此,為增強(qiáng)本文提出的方法對(duì)于不同地區(qū)、不同成像條件下的Sentinal-2影像中水域提取的魯棒性,本文獲取遼寧省不同時(shí)間、不同區(qū)域、不同環(huán)境的Sentinal-2影像制作水域智能提取基準(zhǔn)數(shù)據(jù)集,如表3所示。
表3 不同條件下的Sentinal-2水域影像
Sentinal-2多光譜影像的原始尺寸為10 980像素×10 980像素,為提升模型迭代速度,本文以影像中水域?yàn)橹行牡泥徲蜻M(jìn)行裁切,將裁切后圖像以重采樣的方式調(diào)整為512像素×512像素。數(shù)據(jù)集依據(jù)影像的背景復(fù)雜程度、光照強(qiáng)度、云量覆蓋范圍、水域類型等的不同,共制作樣本11 300張,其中正樣本6 300張,不含水域標(biāo)簽的負(fù)樣本5 000張。正樣本按水域類型可分為河流樣本2 300張、溪流樣本2 000張和面狀水域樣本2 000張。按8∶1∶1的比例將數(shù)據(jù)集劃分為訓(xùn)練樣本、驗(yàn)證樣本和測(cè)試樣本[21-22]。
利用數(shù)據(jù)標(biāo)注軟件labelme人工標(biāo)注影像中水域的邊緣線,制作標(biāo)簽集。將樣本集及其相對(duì)應(yīng)的標(biāo)簽集組合成供深度學(xué)習(xí)使用的水域智能提取基準(zhǔn)數(shù)據(jù)集。
利用上述訓(xùn)練集對(duì)自適應(yīng)水域提取網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練過(guò)程如圖2所示,訓(xùn)練時(shí)長(zhǎng)為14.2 h。其中,“epoch”表示訓(xùn)練集中所有訓(xùn)練樣本被重復(fù)迭代的次數(shù),“train loss”和“val loss”分別表示網(wǎng)絡(luò)在訓(xùn)練集與驗(yàn)證集上的輸出結(jié)果與樣本標(biāo)簽之間的度量,模型在第130個(gè)epoch達(dá)到最優(yōu)化參數(shù),如表4所示。
圖2 模型訓(xùn)練過(guò)程
表4 模型訓(xùn)練最優(yōu)化參數(shù)
本文依據(jù)前述數(shù)據(jù)集中精確標(biāo)注的630個(gè)包含水域的測(cè)試樣本,對(duì)本文方法在自然狀態(tài)下的水域提取魯棒性進(jìn)行評(píng)價(jià)。為了驗(yàn)證該方法的有效性,采用U-Net模型和本文方法分別對(duì)測(cè)試集影像水域進(jìn)行提取實(shí)驗(yàn)并以精確標(biāo)注結(jié)果作為真值標(biāo)簽,得到不同水域類型的提取結(jié)果與上述兩種方法分別對(duì)應(yīng)的6種性能評(píng)價(jià)指標(biāo)均值(表5)。
表5 Sentinel-2影像提取結(jié)果對(duì)比
如表5所示,本文方法與經(jīng)典U-Net模型對(duì)測(cè)試集1 130張含有水體的Sentinel-2多光譜影像進(jìn)行水體提取實(shí)驗(yàn)。結(jié)果表明,本文方法在IoU、召回率、精確率、F1分?jǐn)?shù)4個(gè)關(guān)于提取精度的性能指標(biāo)上略優(yōu)于經(jīng)典U-Net模型。同時(shí),受遙感影像背景復(fù)雜性的影響,本文方法在訓(xùn)練時(shí)間和預(yù)測(cè)時(shí)間兩個(gè)關(guān)于提取速度的性能指標(biāo)上均大幅優(yōu)于經(jīng)典U-Net網(wǎng)絡(luò)。此外,表6展示了上述兩種方法對(duì)測(cè)試集中的Sentinel-2影像中水體的提取效果??梢钥闯?在遙感影像背景較為簡(jiǎn)單的情況下,經(jīng)典U-Net模型對(duì)影像進(jìn)行較深層度的卷積會(huì)損失影像細(xì)節(jié)信息,導(dǎo)致提取不準(zhǔn)確。本文方法依據(jù)顏色熵閾值對(duì)影像進(jìn)行自適應(yīng)提取,能夠?qū)崿F(xiàn)水域信息的高精度快速提取,更適用于實(shí)際應(yīng)用場(chǎng)景。
表6 Sentinel-2影像提取結(jié)果對(duì)比
區(qū)域內(nèi)土壤濕度的變化是區(qū)域氣候、地表水下滲能力、人類活動(dòng)等因素共同作用的結(jié)果。在大氣降水-地表水-土壤水的轉(zhuǎn)化過(guò)程中,土壤水與地表水的補(bǔ)給來(lái)源相同且土壤水主要來(lái)自地表水下滲作用[23]。因此本文依據(jù)康平地區(qū)地表水域面積與同期實(shí)測(cè)不同深度的土壤濕度數(shù)據(jù)構(gòu)建二者之間的關(guān)系,實(shí)現(xiàn)基于水域面積的廣域范圍內(nèi)土壤濕度反演。
擬合優(yōu)度(R2)通常用于衡量?jī)蓚€(gè)變量之間的相關(guān)性。在本文中,通過(guò)計(jì)算相關(guān)系數(shù)來(lái)估計(jì)水域面積對(duì)土壤濕度反演的有效性。當(dāng)水域面積與土壤濕度之間的相關(guān)系數(shù)為正時(shí),這意味著二者之間存在正相關(guān)關(guān)系,反之為負(fù)相關(guān)關(guān)系。此外,R2越大,二者之間的相關(guān)性越強(qiáng)。利用14個(gè)時(shí)相的康平地區(qū)水域面積與同時(shí)刻實(shí)測(cè)地表以下10 cm、40 cm濕度數(shù)據(jù)進(jìn)行回歸分析,如圖3、圖4所示。
圖3 水域面積與10 cm土壤濕度關(guān)系圖
圖4 水域面積與40 cm土壤濕度關(guān)系圖
本文以三次多項(xiàng)式擬合對(duì)土壤濕度進(jìn)行反演。
由圖3、圖4可知,康平地區(qū)水域面積與土壤濕度呈現(xiàn)強(qiáng)相關(guān)關(guān)系,且隨著采樣深度的加深,相關(guān)性減少。在基于水域面積的土壤濕度反演工作中,文獻(xiàn)[12-13]的工作分別證實(shí)了本文得出的結(jié)論。最后,本文使用的遙感影像空間分辨率為10 m,該因素限制了水域面積提取的精度,會(huì)產(chǎn)生一定的解譯精度誤差,這一問(wèn)題會(huì)隨著未來(lái)亞米級(jí)高分影像的使用得到改善。
本文根據(jù)遼寧省多年份Sentinel-2多光譜影像制作大規(guī)模、多場(chǎng)景、多類型、像素級(jí)水域提取基準(zhǔn)數(shù)據(jù)集。該數(shù)據(jù)集依照不同地區(qū)、光照強(qiáng)度、水域類型、背景復(fù)雜程度等方面構(gòu)建,基于該數(shù)據(jù)集利用自適應(yīng)深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)Sentinel-2影像水域面積進(jìn)行像素級(jí)提取。
通過(guò)不同網(wǎng)絡(luò)深度的U-Net水域面積智能解譯模型在保證提取精度的前提下,更好地提升了本文方法對(duì)Sentinel-2影像中水域面積的提取速度。
本文在影像分塊預(yù)測(cè)的基礎(chǔ)上,依據(jù)顏色熵閾值對(duì)待解譯影像進(jìn)行顏色復(fù)雜度判斷,并依據(jù)復(fù)雜程度的不同將其輸入到不同深度的自適應(yīng)水體解譯網(wǎng)絡(luò)。實(shí)驗(yàn)結(jié)果表明,該方法在保證解譯精度的前提下,基本排除了云量遮擋、光照條件等對(duì)水域面積提取造成的影響,改善了因模型復(fù)雜和圖像過(guò)大導(dǎo)致水域提取時(shí)間過(guò)長(zhǎng)的問(wèn)題,水域提取結(jié)果為土壤濕度反演奠定了基礎(chǔ)。本文方法在由630張正樣本組成的獨(dú)立測(cè)試集中的平均IoU為91.301%,F1為95.009%,訓(xùn)練時(shí)間和預(yù)測(cè)時(shí)間分別縮短了25.65%和32.19%。
本文依據(jù)14個(gè)時(shí)相的康平地區(qū)水域面積數(shù)據(jù)及同一時(shí)刻不同深度的土壤濕度實(shí)測(cè)數(shù)據(jù),基于三次多項(xiàng)式擬合的方式構(gòu)建土壤濕度與水域面積之間的關(guān)系,實(shí)現(xiàn)土壤濕度高精度反演。結(jié)果表明,本文所提出的反演方法在10 cm深度的土壤濕度反演實(shí)驗(yàn)中擬合優(yōu)度為0.723 4,在40 cm深度的土壤濕度反演實(shí)驗(yàn)中擬合優(yōu)度為0.568 9。由于本文使用的影像空間分辨率較低會(huì)產(chǎn)生一定程度的解譯誤差,在后續(xù)研究中,擬使用高分辨率遙感影像并結(jié)合機(jī)器學(xué)習(xí)回歸的方式以提升土壤濕度反演的精度。