茍杰松,蔣怡,李宗南,董秀春,吳柏清,劉忠友
(1.四川省農(nóng)業(yè)科學(xué)院遙感應(yīng)用研究所,成都市,610066;2.成都理工大學(xué)旅游與城鄉(xiāng)規(guī)劃學(xué)院,成都市,610059)
水產(chǎn)養(yǎng)殖提供優(yōu)質(zhì)蛋白營養(yǎng)產(chǎn)品,是滿足人們食物消費(fèi)升級的重要途徑[1]。水體信息反映了水量、水質(zhì)、時(shí)空分布等特征,是研究動(dòng)植物生存、生態(tài)系統(tǒng)調(diào)節(jié)、水產(chǎn)養(yǎng)殖活動(dòng)等水資源需求的基礎(chǔ)數(shù)據(jù)[2-3]。提高水體信息的提取能力有助于水產(chǎn)養(yǎng)殖業(yè)科學(xué)化管理,對提升漁業(yè)信息化具有重要作用[4]。
光學(xué)遙感與微波遙感是獲取大范圍水體信息的有效途徑[5-6]。由于數(shù)據(jù)源較多,光學(xué)遙感提取水體信息研究更為成熟和廣泛[7-8]。水體具有典型光譜特征,其光學(xué)反射集中于可見光波長范圍尤其是藍(lán)綠波段內(nèi),在紅外光譜反射率低,易于與其他地物區(qū)分[9]。根據(jù)光學(xué)遙感提取水體信息的技術(shù)原理,當(dāng)前常用的方法主要有基于像元分類的閾值法[10-13]和基于目標(biāo)分類的分類法兩種[14-17]。
閾值法主要是基于影像的光譜特征構(gòu)建各種分類模型和水體指數(shù),根據(jù)閾值判定水體;目標(biāo)分類法包括支持向量機(jī)、面向?qū)ο蠓ā⒆畲笏迫环ǖ?,該類方法能較充分利用影像的光譜、紋理和空間幾何等特征來提取水體信息。遙感影像中水體存在同物異譜、異物同譜的現(xiàn)象:受漂浮物、水草、水深等影響,部分水體光譜特征差異較大;建筑物、陰影等在部分光譜波段的低反射特征與水體近似。因此,閾值法易將低反射率的地物錯(cuò)分為水體。目標(biāo)分類法能較好地利用影像的光譜特征、像元間的空間臨近關(guān)系,相比于閾值法能部分抑制背景噪聲。
隨著卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)在圖像分類和圖像識別方面的成功應(yīng)用[18-20],深度學(xué)習(xí)在遙感影像水體分類和語義分割中能更有效地利用遙感影像的光譜和紋理等特征,減少光譜特征近似水體地物的錯(cuò)分現(xiàn)象,逐漸得到研究及應(yīng)用[21-26]。Yuan等[21]使用CNN和Landsat OLI影像識別格林蘭冰原湖泊水,水體識別結(jié)果優(yōu)于多種傳統(tǒng)分類方法。Zhang等[22]建立一種基于CNN和殘差網(wǎng)絡(luò)ResNet等集成的水體分類模型,在Landsat TM/ETM+和HJ-1影像上有效區(qū)分了水體和陰影區(qū)。Long等[23]集合CNN和邏輯回歸分類器提取Landsat影像水體,比支持向量機(jī)和傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)具有更好的性能。陳前等[24]分別用CNN和Deeplabv3對高分一號影像的水體進(jìn)行分類和語義分割。
隨著深度學(xué)習(xí)在遙感影像處理方面的應(yīng)用,越來越多的研究基于Tensorflow、Caffe、Pytorch等平臺搭建深度學(xué)習(xí)模型,但這些平臺同時(shí)存在流程處理較繁瑣和結(jié)構(gòu)調(diào)試較困難等問題。近年來,國產(chǎn)深度學(xué)習(xí)平臺不斷得到建設(shè)發(fā)展,提供多種從實(shí)際業(yè)務(wù)中反復(fù)淬煉優(yōu)化的訓(xùn)練模型,并支持多種數(shù)據(jù)接口類型和工業(yè)級部署,以百度PaddlePaddle和阿里X-Deep Learning等為代表。已有相關(guān)研究鮮有利用國內(nèi)深度學(xué)習(xí)平臺開展水體信息提取研究。
因此本研究基于百度的PaddlePaddle平臺搭建遙感水體信息提取模型,分析Deeplabv3+語義分割模型和Sentinel 2A遙感影像提取水體信息的效果,為水產(chǎn)養(yǎng)殖遙感水體信息的快速準(zhǔn)確提取提供依據(jù)。
研究區(qū)為四川省成都平原,經(jīng)緯度范圍為103.7°~104.27°E,29.27°~31.34°N,幅員面積約1.3萬km2。該區(qū)域?qū)儆趤啛釒Ъ撅L(fēng)性濕潤氣候,年均氣溫16 °C,年降雨量1 000 mm左右,干濕明顯,雨季主要集中在6月中旬到9月中旬,區(qū)域內(nèi)地勢平坦、城鎮(zhèn)密集、遍布農(nóng)田、水體類型豐富,滿足研究條件。其中,本文水體信息提取模型的訓(xùn)練區(qū)選擇有河流、湖泊、水庫、坑塘等廣布的區(qū)域,主要分布于都江堰市及周邊地區(qū),占地面積約500 km2;測試區(qū)用于評估本文模型和其他對比方法的分類精度,選擇存在大量陰影、建筑和農(nóng)田等對比區(qū),主要分布于新津縣及周邊地區(qū),占地面積約400 km2。
Sentinel2A(S-2A)多光譜影像設(shè)有13個(gè)3種不同空間分辨率的波段(10 m、20 m和60 m),高分六號(GF-6)是中國首顆精準(zhǔn)農(nóng)業(yè)觀測的高分衛(wèi)星,配置2 m 全色/8 m多光譜和16 m多光譜相機(jī)。研究選取S-2A衛(wèi)星10 m和GF-6衛(wèi)星16 m多光譜影像為數(shù)據(jù)源。為保證GF-6影像與S-2A影像空間分辨率一致,將GF-6數(shù)據(jù)重采樣為10 m空間分辨率。
該研究訓(xùn)練區(qū)、測試區(qū)、成都平原應(yīng)用提取區(qū)選取2018—2019年多幅S-2A影像和GF-6影像,包括不同區(qū)域、不同季節(jié)、不同時(shí)相。其中,(1)訓(xùn)練區(qū)選用3個(gè)不同時(shí)期同一區(qū)域S-2A影像,該3幅影像質(zhì)量相對較好,伴隨少量云霧,水體信息季節(jié)性變化明顯,能反映受水量、水質(zhì)變化影響水體表現(xiàn)的不同光譜、紋理特征,可以兼顧到訓(xùn)練模型的泛化能力;(2)測試區(qū)選用1幅S-2A影像,檢驗(yàn)測試模型的分類精度和遷移能力;(3)在成都平原水體面積泛化提取應(yīng)用中,選用2018年的不同區(qū)域S-2A影像拼接得到2018年研究區(qū),選用2020年的不同區(qū)域GF-6影像拼接得到2020年研究區(qū)。
研究基于Deeplabv3+語義分割模型和遙感影像提取水體信息,主要包括3個(gè)步驟:(1)搭建環(huán)境依賴;(2)建立水體信息語義分割數(shù)據(jù)集;(3)訓(xùn)練并保存Deeplabv3+語義分割模型。
1.3.1 Deeplabv3+模型結(jié)構(gòu)
Deeplabv3+[27]是Deeplabv系列的最新版本,在Deeplabv3[28]的基礎(chǔ)上,其加入了解碼器模塊,通過編碼器—解碼器(Encoder-Decoder)借鑒跳步的方式連接低層特征和高層特征,進(jìn)行多尺度信息的融合,原理如圖1所示。
圖1 Deeplabv3+模型原理圖
Encoder以改進(jìn)的Xception替換了ResNet作為骨架網(wǎng)絡(luò),該網(wǎng)絡(luò)由一系列深度可分離卷積組成,提高了模型語義分割的健壯性和運(yùn)行速率。其中,多孔卷積(Atrous Convolution)控制DCNN計(jì)算特征響應(yīng)的分辨率,采用多種不同比率來獲取多尺度的內(nèi)容信息,分別輸出高層特征圖和低層特征圖。Encoder中多孔空間金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)采用4個(gè)并行帶有不同比率的多孔卷積和1個(gè)全局池化(Image Pooling)對高層特征圖分別進(jìn)行單獨(dú)處理,處理后的5個(gè)特征圖融合輸入到一個(gè)1×1卷積中,然后經(jīng)過4倍雙線性內(nèi)插上采樣(Upsample)輸入到Decoder中使用,連接低層網(wǎng)絡(luò)中具有相同空間分辨率的特征圖。
Decoder中首先用一個(gè)1×1卷積處理低層特征圖,減少特征圖通道數(shù),再將其與經(jīng)過4倍雙線性內(nèi)插上采樣的高層特征圖進(jìn)行融合,然后3×3卷積后經(jīng)4倍雙線性內(nèi)插上采樣恢復(fù)至原圖分辨率,最終完成語義分割。
1.3.2 Deeplabv3+模型搭建
研究基于百度PaddlePaddle平臺的PaddleSeg搭建水體信息提取模型。PaddleSeg是端到端圖像分割開發(fā)套件,集合了Deeplabv3+、U-Net、ICNet、PSPNet、HRNet、Fast-SCNN等主流分割模型,支持rgb、rgba和gray三種圖片數(shù)據(jù)接口,內(nèi)置數(shù)據(jù)校驗(yàn)、訓(xùn)練、評估、可視化、預(yù)測等腳本并支持不同的命令行來開啟特定功能和修改默認(rèn)配置。此外,還包括數(shù)據(jù)增強(qiáng)模塊、多進(jìn)程訓(xùn)練和混合精度訓(xùn)練等高級功能。本研究Deeplabv3+模型搭建具體過程如下。
1)搭建環(huán)境依賴。安裝模型運(yùn)行的相關(guān)環(huán)境依賴,主要包括PaddlePaddle 1.6.1、Python 3.7、CUDA 9、PaddleSeg 0.4.0版本。
2)建立水體信息語義分割數(shù)據(jù)集。(1)樣本標(biāo)注:在Deeplabv3+模型的樣本組織過程中,相對于純?nèi)斯な謩?dòng)標(biāo)記,依靠現(xiàn)有的遙感影像與其對應(yīng)目標(biāo)的矢量數(shù)據(jù),半自動(dòng)采集大規(guī)模的遙感影像語義分割樣本,是一種便捷高效方式。本文從成都平原S-2A影像截取了3景同一區(qū)域、不同時(shí)期22 500像素×22 500像素大小的影像切片,在Arcgis中以人工目視解譯的方式,對研究區(qū)具有代表性的水體進(jìn)行標(biāo)記,水體像素被標(biāo)記為1,背景像素則標(biāo)記為0,標(biāo)記結(jié)果轉(zhuǎn)換成png格式,共兩種類型作為深度學(xué)習(xí)模型的訓(xùn)練標(biāo)簽數(shù)據(jù)與模型精度驗(yàn)證的標(biāo)準(zhǔn)。(2)樣本影像的波段選擇:從S-2A 10 m空間分辨率的4個(gè)波段中選取識別率均值最高的3個(gè)波段,本文分別試驗(yàn)了紅—綠—藍(lán)、近紅—紅—藍(lán)、近紅—紅—綠等波段組合,最終選取水體信息提取精準(zhǔn)度最高的近紅(R)—紅(G)—綠(B)波段順序進(jìn)行組合。(3)樣本影像裁剪:由于截取的研究區(qū)影像切片尺度較大,不能直接輸送到模型中訓(xùn)練,因此在語義分割模型訓(xùn)練前要對訓(xùn)練樣本分割。綜合考慮模型訓(xùn)練速度、訓(xùn)練精度以及訓(xùn)練樣本空間結(jié)構(gòu)特征的整體性,通過多尺度的訓(xùn)練樣本分割試驗(yàn),將影像裁剪為512像素×512像素尺度大小的訓(xùn)練樣本,并轉(zhuǎn)換成jpg格式。(4)數(shù)據(jù)集格式:用于水體信息語義分割的數(shù)據(jù)集采用Cityscape數(shù)據(jù)集格式。訓(xùn)練集標(biāo)注數(shù)據(jù)和圖像數(shù)據(jù)各1 176張,用于訓(xùn)練模型。測試集940張圖像數(shù)據(jù),用于檢測模型的精度和泛化能力。其中,部分訓(xùn)練樣本如圖2所示。
圖2 水體信息語義分割訓(xùn)練數(shù)據(jù)集
3)訓(xùn)練并保存Deeplabv3+語義分割模型。(1)訓(xùn)練模型:通過PaddleSeg庫上yalm文件配置各項(xiàng)參數(shù),以微調(diào)(Fine Tune)的方式訓(xùn)練模型,主要設(shè)置包括6項(xiàng):模型骨架網(wǎng)絡(luò)選取Xception_65;初始學(xué)習(xí)率(Learning Rate)為0.001;學(xué)習(xí)策略(Learning Policy)為“poly”[29];權(quán)重衰減(Weight Decay)為0.000 04;訓(xùn)練批數(shù)(Batch Size)為8;迭代次數(shù)(Epoch Number)為50。訓(xùn)練過程中還通過增添數(shù)據(jù)增強(qiáng)模塊(Aug),防止樣本不足帶來的過擬合,提升模型泛化能力和魯棒性,即通過隨步長隨機(jī)縮放、鏡像翻轉(zhuǎn)、圖像旋轉(zhuǎn)、非等比例縮放、色彩抖動(dòng)等多種方式來增加訓(xùn)練數(shù)據(jù)量。(2)保存模型:導(dǎo)出模型及其參數(shù)配置文件,生成預(yù)測yalm配置文件。
執(zhí)行基于Python端的模型預(yù)測腳本,通過訓(xùn)練好的Deeplabv3+模型在線分割測試集S-2A影像和研究區(qū)全域影像,預(yù)測分割后的結(jié)果按文件編號匹配對應(yīng)遙感圖像,并拼接研究區(qū)全域矢量水體圖斑。
本研究以歸一化差分水體指數(shù)法(Normalized Difference Water Index,NDWI)[30]和最大似然法(Maximum Likelihood,ML)[31]等兩種水體信息提取方法作為參照,再輔以2019年3月28日0.5 m的Worldview2高分遙感影像獲取高精度水體分布數(shù)據(jù),評估Deeplabv3+水體信息語義分割方法的性能。隨機(jī)選擇4個(gè)500 m×500 m包含坑塘、水庫等多種水體類型的樣方,獲取0.5 m分辨率水體分類結(jié)果,再重采樣為10 m分辨率的結(jié)果,通過設(shè)定閾值保證重采樣后的結(jié)果與0.5 m水體圖斑總面積不變,以此作為水體信息精度驗(yàn)證的標(biāo)準(zhǔn)。計(jì)算各類方法的水體分類混淆矩陣,得出各方法的漏分誤差、錯(cuò)分誤差、總體精度和Kappa系數(shù)。
根據(jù)表1的精度驗(yàn)證結(jié)果,使用來源于S-2A的樣本數(shù)據(jù)在Deeplabv3+模型下提取水體信息性能最優(yōu),總體精度、Kappa系數(shù)分別達(dá)到94.14%、0.88,較之ML方法和NDWI方法的總體精度分別提升了2.53%和6.04%,Kappa系數(shù)提升了5%和12%,且漏分誤差和錯(cuò)分誤差最低,為6.76%和6.21%。說明該語義分割算法在面對復(fù)雜的地物條件下,通過逐層神經(jīng)網(wǎng)絡(luò)訓(xùn)練,學(xué)習(xí)目標(biāo)深層次信息和整體規(guī)律,實(shí)現(xiàn)目標(biāo)像素級的分類,可提高水體信息的提取精度。
表1 不同水體信息提取方法的精度對比
各方法在不同場景下提取水體信息的具體效果見圖3,其中,圖3(a)以大水面為主;圖3(b)以大面積池塘為主;圖3(c)以小面積池塘和河流為主。各圖周圍均分布建筑、陰影和農(nóng)田作為提取效果對比區(qū)。
在水體面積較大的河段水面和池塘上(圖3(a)、圖3(b)),3種方法的水體信息提取效果與地面真實(shí)標(biāo)簽吻合度都較好,但Deeplabv3+語義分割模型能更有效抑制水面周圍的陰影和建筑等背景干擾,水體錯(cuò)分現(xiàn)象幾乎不存在,ML方法能在一定程度上去除背景干擾,NDWI方法可以通過簡單操作和較快速度提取出大部分水體區(qū)域,有效抑制植被等因素,但背景噪聲相對較多。在小面積池塘和細(xì)長水體分布的場景中(圖3(c)),Deeplabv3+語義分割模型表現(xiàn)較差,小面積水體信息提取效果較一般,對細(xì)小線狀水體提取能力較弱,水體邊緣整體呈現(xiàn)出平滑、規(guī)整的狀態(tài),無法充分描述目標(biāo)邊緣的細(xì)節(jié)信息,而ML方法和NDWI方法在此類場景中則無明顯漏分現(xiàn)象,整體提取效果較好。
(a)
水體面積是決定水產(chǎn)養(yǎng)殖產(chǎn)出能力的重要影響因素[32],本研究中的水產(chǎn)養(yǎng)殖水體主要是指內(nèi)陸?zhàn)B殖水體(包括池塘、山塘水庫以及大水面等封閉型水體,不包括水稻田),而海水養(yǎng)殖水體(包括海水池塘、淺海設(shè)施養(yǎng)殖區(qū))和典型非養(yǎng)殖水體(包括河流、進(jìn)排水渠等流動(dòng)性水體及公園內(nèi)觀賞水體)不作為該文的研究范疇養(yǎng)殖[33]。
本研究利用深度學(xué)習(xí)模型分別對研究區(qū)2018年S-2A衛(wèi)星影像和2020年GF-6衛(wèi)星影像進(jìn)行了水體信息提取,通過規(guī)則識別方法和目視解譯判斷出養(yǎng)殖水體信息,選取2018年青白江區(qū)、新津縣和廣漢市作成都平原養(yǎng)殖水體面積精度驗(yàn)證區(qū),2018年青白江區(qū)、新津縣和廣漢市的養(yǎng)殖水體提取面積分別為472 hm2、615 hm2和785 hm2,對應(yīng)的漁業(yè)統(tǒng)計(jì)年鑒面積分別為490 hm2、571 hm2和805 hm2,驗(yàn)證結(jié)果誤差均≤±10%,達(dá)到全國水產(chǎn)養(yǎng)殖水體資源遙感監(jiān)測項(xiàng)目相關(guān)技術(shù)要求[33-37],滿足區(qū)域級泛化提取條件。
對比分析成都平原兩年間養(yǎng)殖水體面積的變化,結(jié)果如圖4所示。
圖4 成都平原養(yǎng)殖水體面積變化
成都平原2018年和2020年養(yǎng)殖水體面積分別為22.3 khm2和28.6 khm2。圖4(a)中部成都市主城區(qū)范圍基本上無養(yǎng)殖水體面積變化,而成都平原范圍內(nèi)其它區(qū)域如圖4(d),養(yǎng)殖池塘水體面積發(fā)生較多變化。通過對比研究區(qū)S2-A和GF-6兩年的養(yǎng)殖水體影像,發(fā)現(xiàn)養(yǎng)殖水體面積變化易受人類活動(dòng)和季節(jié)性變化影響,人類活動(dòng)如政策驅(qū)動(dòng)限制或禁止某一區(qū)域水產(chǎn)養(yǎng)殖活動(dòng)的產(chǎn)生(如城市建成區(qū)、大型湖泊和水庫等),而季節(jié)性降雨和排灌也對養(yǎng)殖水體面積也有較大影響。
通過驗(yàn)證表明本研究建立的Deeplabv3+語義分割模型可準(zhǔn)確提取水體信息,精度總體優(yōu)于NDWI及ML方法,且能較好地抑制陰影等背景影響,但受限于S-2A遙感影像的空間分辨率較低、訓(xùn)練樣本影像波段數(shù)少、模型誤差等因素,該方法對部分小面積和細(xì)小線狀水體的識別、語義分割等存在不足。對此,通過深度學(xué)習(xí)方法進(jìn)一步提高水體信息提取的精度有待更多相關(guān)工作的改進(jìn),包括測試更多類型的高分辨率遙感數(shù)據(jù)、通過改進(jìn)數(shù)據(jù)接口使用3個(gè)以上波段的遙感影像訓(xùn)練及分割、優(yōu)化模型結(jié)構(gòu)及參數(shù)等。
由于文中定義的養(yǎng)殖水體不包括河流、進(jìn)排水渠等流動(dòng)性水體及公園內(nèi)觀賞水體,這些非養(yǎng)殖水體與內(nèi)陸?zhàn)B殖水體有著共同的紋理和光譜信息,深度學(xué)習(xí)模型提取水體信息是基于像素特征而得,因此無法判斷水體像元是屬于哪一類水體。海水養(yǎng)殖有網(wǎng)箱養(yǎng)殖、灘涂插養(yǎng)、浮筏養(yǎng)殖等,在遙感影像上有其明顯的空間紋理特征,其影像光譜在淺海養(yǎng)殖與深海區(qū)域也有明顯的區(qū)別,已有相關(guān)研究取得了不錯(cuò)的海水養(yǎng)殖水體信息自動(dòng)化提取效果,而內(nèi)陸淡水養(yǎng)殖水體信息提取自動(dòng)化程度也有待進(jìn)一步提升和挖掘。
1)基于Deeplabv3+模型的水體信息提取總體精度為94.14%,Kappa系數(shù)為0.88,相比于其他方法,Deeplabv3+語義分割模型能有效抑制陰影、建筑物等背景噪聲,提高了水體信息提取精細(xì)化程度,具有水體信息提取的適用性。
2)基于深度學(xué)習(xí)平臺PaddlPaddle的PaddleSeg建立的水體信息提取模型,通過較少樣本數(shù)據(jù)、參數(shù)微調(diào)、簡易腳本命令,可遷移模型實(shí)現(xiàn)水體信息區(qū)域級泛化提取能力,提高了水體信息提取自動(dòng)化程度,具有水體信息提取的便利性。
3)對研究區(qū)的養(yǎng)殖水體面積提取結(jié)果表明,2018年和2020年成都平原養(yǎng)殖水體面積分別為22.3 khm2和28.6 khm2,驗(yàn)證區(qū)結(jié)果誤差≤±10%,達(dá)到全國水產(chǎn)養(yǎng)殖水體資源遙感監(jiān)測項(xiàng)目相關(guān)技術(shù)要求。
中國農(nóng)機(jī)化學(xué)報(bào)2021年3期