陳蘇晉,孟令奎,張 文
(武漢大學(xué)遙感信息工程學(xué)院,湖北 武漢 430079)
隨著我國(guó)治水主要矛盾的轉(zhuǎn)變,各級(jí)河長(zhǎng)都需要投入到“清四亂”的工作中,其中,以圍湖造田、坑塘養(yǎng)殖為典型代表的“亂占”現(xiàn)象就是河湖治理的難點(diǎn)之一。為加強(qiáng)對(duì)河湖水域規(guī)劃的岸線管理并保護(hù)水生態(tài),必須嚴(yán)令禁止以各種手段和名義非法侵占沿線河道、填湖造田、私建坑塘、非法采砂的行為。同時(shí),也需要對(duì)岸線水域“亂占”濫用、多占少用、占而不用等突出問題進(jìn)一步開展清理和專項(xiàng)整治,恢復(fù)原有河湖水域規(guī)劃岸線生態(tài)管理功能[1-2]。由于遙感影像具備覆蓋范圍廣、數(shù)據(jù)量大、時(shí)效性強(qiáng)的特點(diǎn),將遙感監(jiān)測(cè)技術(shù)應(yīng)用于“亂占”問題的檢測(cè),能夠減少實(shí)地調(diào)研的人力消耗,助力河長(zhǎng)工作[3]。
近年來,遙感技術(shù)在水利方面的應(yīng)用優(yōu)勢(shì)逐漸凸顯,面向水利應(yīng)用的分類算法也逐漸趨于成熟。歸一化差分水體指數(shù)(NDWI)閾值法、支持向量機(jī)(SVM)及面向?qū)ο蟮确椒?,都在基?GF-1 遙感影像的鄱陽湖水體信息的提取實(shí)驗(yàn)中進(jìn)行了應(yīng)用嘗試[4],神經(jīng)網(wǎng)絡(luò)也應(yīng)用于海水養(yǎng)殖區(qū)的識(shí)別[5]。運(yùn)用研究區(qū)域光譜、紋理和形狀特點(diǎn)顯著的優(yōu)勢(shì)提取特征向量,能夠?qū)崿F(xiàn)地物目標(biāo)的精確提取[6]。歸一化建筑指數(shù)(NDBI)、歸一化植被指數(shù)(NDVI)和NDWI等特征描述方法,還適用于進(jìn)行多種地物類別的變化檢測(cè)[7]。
為此本研究選用 GF-1 衛(wèi)星 PMS 影像,通過多特征融合的方法提取坑塘養(yǎng)殖和圍湖造田 2 種“亂占”對(duì)象的特征,使用 SVM 分類器實(shí)現(xiàn)目標(biāo)識(shí)別。
由于圍湖造田與坑塘養(yǎng)殖 2 類“亂占”現(xiàn)象差異性較大,故而分別提取 2 類地物的特征,再執(zhí)行分類,采用因地制宜的方式完成“亂占”識(shí)別。
圍湖造田區(qū)域經(jīng)歷水陸變遷,與水體具備不同的光譜反射特性。由于遙感方法是根據(jù)地物呈現(xiàn)的狀態(tài)進(jìn)行分類的,在無法進(jìn)行實(shí)地調(diào)研的情況下,為避免缺漏,暫且將湖泊范圍內(nèi)的非水體且非建筑區(qū)域全部認(rèn)定為疑似圍湖造田區(qū)域,包括草地、林地、裸地等。利用NDWI提取影像范圍內(nèi)水體的特性,可以通過逆向選擇提取湖泊矢量范圍內(nèi)的非水體區(qū)域。由于建筑區(qū)域不屬于提取目標(biāo),故而NDWI偶爾誤分建筑和水體的問題,不會(huì)對(duì)提取造成影響。疑似圍湖造田區(qū)域在作物生長(zhǎng)季(我國(guó)大部分地區(qū)以 5—10 月為主要代表)有明顯的植被覆蓋,故而可以利用植被的反射特性作為該區(qū)域的特征,運(yùn)用NDVI或NDBI表示,從而與非水體區(qū)域中的建筑物進(jìn)行區(qū)分。綜上所述,通過計(jì)算NDWI,NDVI或NDBI,能夠?qū)σ伤茋鷫?、建筑與水體等區(qū)域進(jìn)行劃分。
坑塘養(yǎng)殖區(qū)域大多為人工修葺的蓄水量較小且形狀相對(duì)規(guī)則的矩形水面,常常呈現(xiàn)集中分布的特點(diǎn),且排列整齊。砂土、黏土和壤土建塘等修建方式的差異,會(huì)導(dǎo)致坑塘具備不同的波譜反射特性,故不適合用波譜特性提取坑塘。但人工建造的坑塘養(yǎng)殖區(qū)通常為整齊排列的矩形水面,紋理和幾何特征顯著。每個(gè)坑塘的水域面積小,邊界平直,轉(zhuǎn)角接近 90°,一般會(huì)有大量尺寸相近的坑塘緊密排列,開闊水域周邊的坑塘通常沿岸線分布。由于尺寸原因,大部分坑塘的紋理特征在中分辨率影像中很難辨識(shí),但當(dāng)使用高空間分辨率遙感影像時(shí),能夠較好地反映坑塘的紋理特性。此外,受大氣環(huán)流的影響,我國(guó)大部分地區(qū)在冬季易形成西北季風(fēng),容易掀起風(fēng)浪,從而引起強(qiáng)烈的水體對(duì)流。為減少風(fēng)浪對(duì)堤壩的沖擊,在修建坑塘?xí)r常??s短南北走向的距離,以東西向長(zhǎng),南北向短的矩形為主要形式[8]。
綜合考慮上述特征,使用光譜特性提取圍湖造田區(qū)域特征,使用紋理特性提取坑塘養(yǎng)殖區(qū)域特征。
根據(jù)前期準(zhǔn)備階段收集的“亂占”輿情信息,結(jié)合目視判讀,選取位于黑龍江省和江蘇省的 4 個(gè)湖泊作為研究區(qū)域,各湖泊所屬的區(qū)位和面臨的“亂占”問題如表 1 所示。
表 1 “亂占”問題研究區(qū)域
運(yùn)用 GF-1 衛(wèi)星 PMS 影像數(shù)據(jù)進(jìn)行“亂占”目標(biāo)的識(shí)別,分別借助光譜和紋理特征提取圍湖造田和坑塘養(yǎng)殖 2 類地物。
將 GF-1 衛(wèi)星影像投入應(yīng)用前需要先消除大氣輻射和地形起伏等因素對(duì)遙感數(shù)據(jù)造成的輻射和幾何誤差,因此借助 PIE 遙感圖像處理軟件按照輻射定標(biāo)、大氣校正、正射校正、影像融合的流程對(duì)影像進(jìn)行預(yù)處理操作。
NDWI能夠有效區(qū)分水體和圍湖造田區(qū)域,而NDBI和NDVI可以對(duì)圍湖造田區(qū)域和以建筑物為主要表現(xiàn)形式之一的不透水表面進(jìn)行區(qū)分[9]。其中:NDWI由綠波段和近紅外波段運(yùn)算得到,NDVI由紅波段和近紅外波段運(yùn)算得到,NDBI由近紅外波段和中紅外波段運(yùn)算得到。由于 GF-1 衛(wèi)星影像能夠提供藍(lán)、綠、紅和近紅外 4 個(gè)波段,不具備中紅外波段,故而選用NDWI和NDVI共同描述圍湖造田區(qū)域的特征。
在特征提取過程中,本研究采用容許少量錯(cuò)分,但盡量避免缺漏的策略,將草地、林地、耕地及裸地等疑似區(qū)域均判斷為圍湖造田區(qū)域,盡最大可能使得所有圍湖造田區(qū)域均能夠被提取出來。
灰度共生矩陣(GLCM)在紋理特征提取方面經(jīng)過大量實(shí)驗(yàn)驗(yàn)證具備優(yōu)良的性能[10],本研究選取以下 4 個(gè)特征統(tǒng)計(jì)量作為紋理分類依據(jù):1)對(duì)比度(Con),反映像素與其鄰域像素的亮度對(duì)比情況,對(duì)比度越大,代表亮度值變化越快;2)角二階矩(Asm),描述影像紋理的粗糙程度,角二階矩越大表示紋理的粗糙程度越高;3)相關(guān)性(Cor),描述灰度共生矩陣元素在一定方向上的相似程度,相關(guān)性越大表示在該方向的相似程度越大;4)逆差矩(Idm),描述影像局部紋理變化的大小,逆差矩越大紋理越規(guī)則。
特征提取算法在灰度共生矩陣的基礎(chǔ)上,還以方向梯度直方圖(HOG)作為補(bǔ)充,構(gòu)建如圖 1 所示的提取流程。
計(jì)算 HOG 特征和 GLCM 的 4 個(gè)統(tǒng)計(jì)量,合并即可得到該影像的紋理特征向量。使用該技術(shù)流程進(jìn)行特征提取,能夠有效提升坑塘養(yǎng)殖區(qū)域與周圍地物的區(qū)分度。
由于 SVM 具有抗噪聲性能優(yōu)良、對(duì)樣本干預(yù)需求量相對(duì)較少、穩(wěn)定性好、自動(dòng)學(xué)習(xí)效率高等優(yōu)勢(shì),因此選用 SVM 對(duì)“亂占”目標(biāo)執(zhí)行監(jiān)督分類。
2.4.1 訓(xùn)練樣本選取
圖 1 基于灰度共生矩陣的坑塘養(yǎng)殖特征提取流程
監(jiān)督分類訓(xùn)練樣本的質(zhì)量將直接影響分類精度。為了能夠?yàn)橛?jì)算機(jī)自動(dòng)分類提供足夠多信息的訓(xùn)練樣本,結(jié)合 2019 年全國(guó)水體遙感監(jiān)測(cè)數(shù)據(jù)產(chǎn)品更新的湖泊變化情況記錄,以及前期準(zhǔn)備工作中對(duì)微博平臺(tái)上“四亂”輿情相關(guān)信息的抓取結(jié)果,在Google Earth Pro 提供的高分辨率影像基礎(chǔ)上進(jìn)行目視判讀,確定目標(biāo)類別,人工繪制樣本區(qū)域,利用ArcGIS 裁剪工具完成樣本的采集工作。由于 GF-1衛(wèi)星自 2014 年開始能夠提供全年的高分辨率影像,在選取樣本時(shí),主要關(guān)注 2014—2019 年有典型“亂占”現(xiàn)象的湖泊。
樣本采集的具體流程如圖 2 所示,各類地物累計(jì)采集的樣本數(shù)量如表 2 所示。
圖 2 樣本采集流程
2.4.2 “亂占”目標(biāo)檢測(cè)
根據(jù)圍湖造田和坑塘養(yǎng)殖 2 類“亂占”目標(biāo)特征完成訓(xùn)練樣本選擇后,可按圖 3 所示的流程實(shí)現(xiàn)基于監(jiān)督學(xué)習(xí)的“亂占”目標(biāo)識(shí)別。
表 2 各類地物樣本數(shù)量 個(gè)
圖 3 基于監(jiān)督學(xué)習(xí)的“亂占”目標(biāo)識(shí)別流程
使用 SVM 進(jìn)行“亂占”目標(biāo)識(shí)別的流程如下:
1)初始化。為便于提取特征,首先將所有訓(xùn)練影像大小統(tǒng)一調(diào)整至 256 像素×256 像素,然后確定特征向量尺寸,對(duì)每一類樣本分別初始化特征矩陣。
2)構(gòu)建訓(xùn)練樣本特征向量和標(biāo)簽。首先按照地物類別,對(duì)訓(xùn)練集中的樣本逐個(gè)提取影像的特征向量,更新特征矩陣;接著將圖像所屬的類別描述記錄為該影像的訓(xùn)練標(biāo)簽;最后將訓(xùn)練影像的特征和標(biāo)簽對(duì)照添加至特征集和標(biāo)簽集。訓(xùn)練集中的所有影像都需遵循上述流程完成特征提取并添加標(biāo)簽。
3)構(gòu)建測(cè)試樣本特征向量和標(biāo)簽。此構(gòu)建流程與構(gòu)建訓(xùn)練樣本特征向量和標(biāo)簽流程相同。
4)使用選取的各地物類別樣本數(shù)據(jù)集,訓(xùn)練SVM 分類器。
5)使用分類器對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè)分類,比較測(cè)試數(shù)據(jù)集的預(yù)測(cè)結(jié)果與樣本實(shí)際所屬的類別,生成混淆矩陣展示分類效果。
6)應(yīng)用分類器識(shí)別未標(biāo)識(shí)目標(biāo)。輸入未標(biāo)識(shí)的影像,使用分類器判斷其所屬地物類別。
在特征提取的基礎(chǔ)上進(jìn)行“亂占”目標(biāo)識(shí)別,能夠有助于發(fā)現(xiàn)更多的“亂占”問題。本研究通過訓(xùn)練的 SVM 分類器,對(duì)不同區(qū)位或時(shí)間的遙感影像中的 2 種“亂占”目標(biāo)進(jìn)行分類識(shí)別。表 3 為采用裁剪后的小區(qū)域進(jìn)行識(shí)別測(cè)試的示例,分別展示圍湖造田和坑塘養(yǎng)殖目標(biāo)區(qū)域的識(shí)別結(jié)果,示例中具備典型坑塘和農(nóng)田特征的目標(biāo)都能夠被成功識(shí)別。
表 3 圍湖造田和坑塘養(yǎng)殖識(shí)別結(jié)果示例
向訓(xùn)練好的分類器中輸入待識(shí)別的樣本,即可預(yù)測(cè)該樣本影像所屬的地物類型,最終通過可視化途徑輸出識(shí)別的結(jié)果。
企業(yè)資源包括有形物質(zhì)資源和無形的資源,有形的物質(zhì)資源包括人、財(cái)、物等基本物質(zhì)資源,無形資源包括品牌、社會(huì)資本、商譽(yù)和技術(shù)等無形資源或資產(chǎn)。一個(gè)企業(yè)具有良好的成長(zhǎng)性,就可以高效率地開發(fā)和利用已有的資源以及充分挖掘未發(fā)現(xiàn)的管理能力。電子商務(wù)企業(yè)資源成長(zhǎng)性的大小可以由這兩方面的成長(zhǎng)性指標(biāo)群來測(cè)量,有形的資源的成長(zhǎng)性是量的增加,如市場(chǎng)占有率的提升、總資產(chǎn)的增加、固定資產(chǎn)的增加、企業(yè)員工的增加等;無形的資源的成長(zhǎng)性是質(zhì)的增加,如技術(shù)的進(jìn)步、企業(yè)員工素質(zhì)的提升、社會(huì)資本的增加、品牌價(jià)值的增加等。
本研究先使用NDVI和NDWI指數(shù)法凸顯出圍湖造田區(qū)域的特征,再通過訓(xùn)練 SVM 分類器對(duì)水體周邊的建筑、農(nóng)田、坑塘及自然水體進(jìn)行區(qū)分,分類精度如表 4 所示。
表 4 “亂占”目標(biāo)分類精度 %
在分類過程中發(fā)現(xiàn),浮水植物密集的自然水體容易與農(nóng)作物種植區(qū)域相混淆。由于水面大量植被的遮擋,該區(qū)域水體的反射特性減弱,主要表現(xiàn)為植被的光譜反射特性。
利用指數(shù)法進(jìn)行分類實(shí)驗(yàn)時(shí),由于較好地分離了建筑區(qū)和水體(含坑塘養(yǎng)殖和自然水體),因此,在利用紋理特征識(shí)別坑塘養(yǎng)殖區(qū)域時(shí),僅考慮坑塘養(yǎng)殖、圍湖造田及自然水體 3 類地物的分類。
當(dāng)前實(shí)驗(yàn)結(jié)果顯示:圍湖造田和坑塘養(yǎng)殖 2 類地物的召回率較高,對(duì) 2 種“亂占”目標(biāo)的提取效果總體良好。但是當(dāng)前研究區(qū)域內(nèi)獲取的樣本數(shù)量有限,模型的普適性仍有待驗(yàn)證。
為驗(yàn)證“亂占”識(shí)別模型的普適能力,以坑塘養(yǎng)殖區(qū)域的識(shí)別為例,在大比例尺遙感分類圖像高分辨率樣本數(shù)據(jù)集的基礎(chǔ)上重新進(jìn)行篩選,組建能夠反映湖泊“亂占”地物特點(diǎn)的擴(kuò)展樣本數(shù)據(jù)集,進(jìn)行擴(kuò)展測(cè)試,檢驗(yàn)?zāi)P屯茝V后的識(shí)別精度。該數(shù)據(jù)集與表 2 所示的基于 GF-1 衛(wèi)星影像制作的數(shù)據(jù)集相互獨(dú)立,擴(kuò)展數(shù)據(jù)集中樣本僅包含 RGB 波段,但具有相似的空間分辨率,同屬于高分辨率遙感對(duì)地觀測(cè)數(shù)據(jù)。
樣本選擇主要考慮湖泊管理范圍內(nèi)對(duì)應(yīng)地物類型表現(xiàn)出的特點(diǎn),具體選擇規(guī)則如下:
1)坑塘養(yǎng)殖區(qū)域大多表現(xiàn)為連續(xù)排列的矩形,鮮有分散、獨(dú)立的不規(guī)則形狀;
3)水體表面較為平靜,部分水面有輕微波紋,罕見大范圍明顯浪花。
按照選擇規(guī)則選取得到的各地物類別影像數(shù)量如表 5 所示。
表 5 擴(kuò)展測(cè)試集各類樣本數(shù)量 個(gè)
測(cè)試所得的混淆矩陣如表 6 所示,其中:所在行對(duì)應(yīng)的地物類型為測(cè)試樣本的實(shí)際所屬類別,所在列對(duì)應(yīng)的地物類型為模型分析得出的判定結(jié)果。
表 6 混淆矩陣 個(gè)
綜合混淆矩陣與參與測(cè)試的樣本數(shù)量可知,在平衡 3 類地物的樣本數(shù)量后,該測(cè)試對(duì)坑塘養(yǎng)殖對(duì)象的分類精度為 85.96%,召回率為 82.94%。本研究提出的“亂占”識(shí)別模型,在擴(kuò)展測(cè)試中所得的分類精度和召回率均優(yōu)于 80%,可見能夠適用于不同數(shù)據(jù)集的湖泊“亂占”目標(biāo)識(shí)別,普適性能良好。
監(jiān)督制度的建立是一項(xiàng)系統(tǒng)工程,為推動(dòng)水利現(xiàn)代化,必須加強(qiáng)水利信息化監(jiān)管體系的建設(shè)[11]?!扒逅膩y”工作是水利信息化監(jiān)管體系建設(shè)的重要組成部分,本研究聚焦圍湖造田和坑塘養(yǎng)殖 2 類河湖“亂占”目標(biāo)的識(shí)別,針對(duì)兩者的特征采取不同的識(shí)別策略,致力于為河長(zhǎng)監(jiān)管“清四亂”工作提供技術(shù)支持。
實(shí)驗(yàn)結(jié)果表明:選用高空間分辨率的衛(wèi)星影像,通過多特征融合的方法執(zhí)行監(jiān)督分類,對(duì)“亂占”目標(biāo)進(jìn)行識(shí)別,能夠?qū)焯锖涂犹琉B(yǎng)殖2 類研究對(duì)象取得較好的提取精度,研究成果可以適用于不同影像數(shù)據(jù)集中“亂占”目標(biāo)的識(shí)別,為水利信息化監(jiān)管體系建設(shè)提供助力,協(xié)助河長(zhǎng)發(fā)現(xiàn)“四亂”問題,監(jiān)管“四亂”整改。
后期將繼續(xù)探究降低本研究運(yùn)算過程中內(nèi)存占用的方法,嘗試推廣至更大范圍影像中的“亂占”目標(biāo)識(shí)別,同時(shí)優(yōu)化模型提高分類的精度。