薛雨 姚金明 盧慶輝 楊忍
摘? 要:冬小麥?zhǔn)俏覈?guó)重要的糧食作物之一,準(zhǔn)確提取冬小麥種植區(qū)域范圍對(duì)保證糧食安全具有重要意義。文章以山東省威海乳山市為研究區(qū)域,使用GF-1C、GF-6、ZY-3多源影像數(shù)據(jù),提取乳山市冬小麥種植范圍。根據(jù)乳山市冬小麥種植及生長(zhǎng)情況,選取4月中旬至5月上旬最佳時(shí)期的衛(wèi)星影像;用計(jì)算NDVI作為新波段替代紅光波段與綠、藍(lán)波段進(jìn)行合成,更加突出植被信息;利用深度學(xué)習(xí)訓(xùn)練冬小麥提取模型,實(shí)現(xiàn)冬小麥種植范圍的自動(dòng)提取,提取精度為94.39%,效果較好。
關(guān)鍵詞:冬小麥;NDVI;深度學(xué)習(xí);多源影像
中圖分類號(hào):TP18? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2023)02-0120-03
Research on Winter Wheat Extraction from Multi-Source Images Based on NDVI and Deep Learning
XUE Yu, YAO Jinming, LU Qinghui, YANG Ren
(Shandong Provincial Institute of Land Surveying and Mapping, Jinan? 250013, China)
Abstract: Winter wheat is one of the important food crops in China. It is great significance to extract the range of planting area of winter wheat accurately for ensuring food security. In this paper, we take Rushan City, Weihai City, Shandong Province as the research area, and use GF-1C, GF-6, ZY-3 multi-source image data to extract the planting range of winter wheat in Rushan City. According to the planting and growth of winter wheat in Rushan city, satellite images of the best period from mid-April to early May are selected; calculate NDVI as a new band to replace the red band and the green and blue band to synthesize, more prominent vegetation information; deep learning is used to train the winter wheat extraction model to realize automatic extraction of the planting range of winter wheat with an extraction accuracy of 94.39%, it has a good effect.
Keywords: winter wheat; NDVI; deep learning; multi-source image
0? 引? 言
習(xí)近平總書記指出:“我國(guó)是人口眾多的大國(guó),解決好吃飯問(wèn)題,始終是治國(guó)理政的頭等大事”。估算糧食產(chǎn)量對(duì)于制定國(guó)家社會(huì)經(jīng)濟(jì)發(fā)展規(guī)劃、確保國(guó)家糧食安全和社會(huì)穩(wěn)定、指導(dǎo)和宏觀調(diào)控種植結(jié)構(gòu)具有重要意義[1]。我國(guó)是世界上小麥總產(chǎn)量最高,消費(fèi)量最大的國(guó)家,其種植面積和產(chǎn)量在全國(guó)糧食生產(chǎn)中占有舉足輕重的地位[2]。傳統(tǒng)的農(nóng)業(yè)統(tǒng)計(jì)和調(diào)查方法,耗費(fèi)巨大的人力物力,且容易出現(xiàn)漏提的現(xiàn)象;而遙感技術(shù)的發(fā)展,為大區(qū)域冬小麥種植區(qū)域監(jiān)測(cè)和糧食產(chǎn)量的預(yù)估,提供了更便捷、更高效的方式。
國(guó)內(nèi)外眾多學(xué)者對(duì)基于遙感影像的冬小麥自動(dòng)提取開(kāi)展了廣泛研究,主要方法歸納為:
(1)基于圖像分割和NDVI的冬小麥種植區(qū)域提?。和醣糖绲萚3]構(gòu)建了基于NDVI時(shí)間序列的冬小麥識(shí)別模型,利用圖像分割的方法獲取地塊邊界信息,提高目標(biāo)識(shí)別的準(zhǔn)確性,總體分類精度達(dá)98.74%。
(2)基于多特征提取和優(yōu)選的冬小麥面積提?。簵钷ビ畹萚1]基于多時(shí)相光譜、植被指數(shù)和紋理特征計(jì)算特征變量并構(gòu)建特征變量組合,然后基于隨機(jī)森林分類器對(duì)優(yōu)選后的特征組合進(jìn)一步分類,總體精度達(dá)到96.3%。
(3)王曉曉等基于Sentinel-2和Landset8兩種數(shù)據(jù)源的光譜特征、紋理特征、植被指數(shù)特征組合數(shù)據(jù),利用隨機(jī)森林與支持向量機(jī)對(duì)冬小麥進(jìn)行提取[4]。
(4)周亮等利用MODIS類型數(shù)據(jù)建立了基于卷積神經(jīng)網(wǎng)絡(luò)的冬小麥種植估產(chǎn)模型,對(duì)北方小麥區(qū)域的平原區(qū)估產(chǎn),精度較高[5]。
山東是糧食生產(chǎn)大省,是保障全國(guó)糧源供應(yīng)的重要“根據(jù)地”和“大糧倉(cāng)”[6]。本研究基于GF1、GF6、ZY3等多源衛(wèi)星影像數(shù)據(jù),提取2022年威海乳山市冬小麥空間分布,便于為區(qū)域作物相關(guān)研究提供支撐,為大面積農(nóng)作物提取提供新思路和方法。
1? 研究區(qū)域和數(shù)據(jù)
1.1? 研究區(qū)概況
乳山市隸屬于山東威海市,因“大乳山”在境內(nèi)而得名。乳山地處北緯36°41′—37°08′,東經(jīng)121°11′—121°51′之間,東西60千米,南北48千米,總面積1 665平方千米,海岸線長(zhǎng)199.27千米,位于青島、威海、煙臺(tái)三市銜接腹地,南邊瀕臨黃海,與韓國(guó)、日本隔海相望[5]。乳山地處暖溫帶季風(fēng)型大陸性氣候區(qū),四季分明,季風(fēng)進(jìn)退較明顯,具有雨水豐沛、氣候溫和、光照充足、無(wú)霜期長(zhǎng)的特點(diǎn)[6],非常適合糧食作物生長(zhǎng),2021年糧食種植面積55.1萬(wàn)畝,選擇該區(qū)域進(jìn)行研究具有一定代表性,乳山市具體位置如圖1所示。
1.2? 數(shù)據(jù)情況
本研究方法對(duì)影像質(zhì)量要求較高,云彩壓蓋、天氣等因素都對(duì)影像質(zhì)量有所影響,影像質(zhì)量越高,提取效果越好。并且根據(jù)歷年研究區(qū)域內(nèi)冬小麥發(fā)育期統(tǒng)計(jì),乳山冬小麥返青期為每年3月中旬以后,但是在影像上體現(xiàn)較為明顯的是4月中旬至5月上旬,根據(jù)自然資源部定期下發(fā)的影像,我們篩選出GF-1C、GF-6、ZY-3三種類型影像。光學(xué)衛(wèi)星GF-1B、C、D星座2018年3月31日成功發(fā)射,是中國(guó)第一個(gè)民用的高分辨率星座,由狀態(tài)一致、性能相同的3顆業(yè)務(wù)衛(wèi)星組成,空間分辨率為多光譜優(yōu)于8米、全色2米,單星成像幅寬大于60千米[7],在開(kāi)展自然資源全覆蓋、全要素、全天候?qū)崟r(shí)監(jiān)測(cè)和調(diào)查方面發(fā)揮至關(guān)重要的作用。GF-6衛(wèi)星是一顆低軌光學(xué)遙感衛(wèi)星,采用CAST 2000平臺(tái),其攜帶的寬幅相機(jī)(wide field view, WFV)共有8個(gè)波段,相比于GF-1號(hào)衛(wèi)星4個(gè)波段,新增了紅邊1、紅邊2、紫和黃4個(gè)波段[8]。我國(guó)自主研發(fā)的高分辨率民用立體測(cè)圖衛(wèi)星資源三號(hào)(ZY-3)于2016年發(fā)射成功,它實(shí)現(xiàn)了長(zhǎng)期、穩(wěn)定、連續(xù)獲取高分辨率立體影像,同時(shí)具備獲取多光譜影像的能力,廣泛應(yīng)用于基礎(chǔ)設(shè)施建設(shè)、國(guó)土資源調(diào)查及檢測(cè)、自然災(zāi)害防治等領(lǐng)域,成為我國(guó)測(cè)繪事業(yè)長(zhǎng)期發(fā)展的有力支撐[9]。
2? 研究方法
2.1? 技術(shù)路線
本研究技術(shù)路線如圖2所示,首先對(duì)影像進(jìn)行校正和裁剪、樣本區(qū)域選擇、勾畫冬小麥樣本等處理,然后計(jì)算影像的NDVI值、影像分割、模型訓(xùn)練、影像預(yù)測(cè)、精度評(píng)價(jià)。
2.2? 影像處理
由于影像成像過(guò)程中受到氣溶膠等因素的影響,導(dǎo)致影像質(zhì)量不高,從而影響樣本的勾畫及深度學(xué)習(xí)的模型訓(xùn)練。為了獲取真實(shí)地表反射率以準(zhǔn)確的計(jì)算植被指數(shù),采用FLAASH模型對(duì)研究區(qū)域內(nèi)的影像進(jìn)行了大氣校正;利用DEM數(shù)據(jù),對(duì)影像進(jìn)行正射校正,使冬小麥的位置能夠準(zhǔn)確匹配,最終將影像數(shù)據(jù)統(tǒng)一為GCS-WGS-1984坐標(biāo)系。
2.3? 冬小麥樣本勾畫
根據(jù)乳山市的地形及冬小麥的種植情況,我們選取了12個(gè)樣本區(qū)域。樣本區(qū)域的選擇需要遵循以下兩個(gè)原則:
(1)樣本有正樣本和負(fù)樣本之分,并且一定數(shù)量的負(fù)樣本有利于提高預(yù)測(cè)的準(zhǔn)確性。在保證充足的冬小麥樣本時(shí),盡可能選取該研究區(qū)域典型的負(fù)樣本,例如與冬小麥相似的韭菜、大蒜等。
(2)根據(jù)影像上冬小麥的分布特點(diǎn)選取,劃分類型為較少、較多、很多等,用來(lái)減少人工標(biāo)注的工作量。利用ArcMap軟件對(duì)樣本區(qū)域的冬小麥樣本進(jìn)行勾畫,如圖3所示。正樣本即為冬小麥,我們?cè)赾lass字段中標(biāo)注為“1”。負(fù)樣本即不是冬小麥的樣本,包括樣本區(qū)域內(nèi)的其他植被、居民地、水系、道路等類型數(shù)據(jù),我們?cè)赾lass字段中標(biāo)注為“0”。
2.4? NDVI波段合成
植被指數(shù)是遙感技術(shù)在實(shí)際應(yīng)用范疇中反映地表植被各類信息的來(lái)源,它在定性和定量評(píng)估植被覆蓋度方面已經(jīng)得到普遍應(yīng)用。當(dāng)前有多種植被指數(shù):歸一化植被指數(shù)(NDVI)、陰影植被指數(shù)(SVI)、增強(qiáng)型植被指數(shù)(EVI)等,其中NDVI為判別植被狀況的重要指標(biāo)。NDVI值如式(1)所示:
NDVI=(ρNIR-ρR)/(ρNIR+ρR)
式中,ρNIR為近紅外光波段的反射率,ρR為紅光波段的反射率。利用ArcGIS中的Raster Calculator工具計(jì)算NDVI值,然后用NDVI值波段作為新的波段替代紅光波段,與綠光和藍(lán)光波段進(jìn)行合成,這樣處理能夠讓冬小麥等植被信息更加突出,便于精準(zhǔn)識(shí)別。
2.5? 影像分割
深度學(xué)習(xí)需要大量的樣本作為訓(xùn)練基礎(chǔ)。本研究基于圖像塊樣本中需要將影像和樣本一一對(duì)應(yīng),且位置、面積也需要完全對(duì)應(yīng),這就需要對(duì)影像進(jìn)行分割。首先將樣本按照樣本區(qū)域mask進(jìn)行裁剪,然后將矢量樣本轉(zhuǎn)換成柵格,同樣將影像進(jìn)行裁剪,影像和樣本的名稱完全對(duì)應(yīng)。由于選取的單個(gè)樣本區(qū)域面積在5平方千米左右,不符合深度學(xué)習(xí)的模型訓(xùn)練,利用軟件將樣本和影像裁剪成512×512像素的小影像。如圖4所示。
2.6? 模型訓(xùn)練
深度學(xué)習(xí)可以利用卷積神經(jīng)網(wǎng)絡(luò)具備的學(xué)習(xí)性,在數(shù)據(jù)累積的情況下成長(zhǎng)為預(yù)測(cè)冬小麥種植面積的模型。本研究中的模型訓(xùn)練是根據(jù)現(xiàn)有的樣本數(shù)據(jù)及影像,利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)影像數(shù)據(jù)和樣本數(shù)據(jù)進(jìn)行擬合。本研究的樣本共129組數(shù)據(jù),其中訓(xùn)練集117組,驗(yàn)證集12組,驗(yàn)證集占比為10%。由于樣本數(shù)量不大,筆者將模型訓(xùn)練的輪回?cái)?shù)epoch設(shè)置較高,每次學(xué)習(xí)前向和反向傳播使用的圖像數(shù)量(batch size)設(shè)置為4,以確保模型充分學(xué)習(xí)特征,達(dá)到較好的效果。由于影像類型不同,表現(xiàn)的色彩形態(tài)也不同,本研究根據(jù)影像類型訓(xùn)練了3種模型。
2.7? 結(jié)果分析
模型訓(xùn)練完成后,對(duì)研究區(qū)域范圍內(nèi)的影像進(jìn)行預(yù)測(cè)。預(yù)測(cè)的結(jié)果同樣是柵格數(shù)據(jù),最終轉(zhuǎn)換為shp格式,以便于分析處理。本次冬小麥預(yù)測(cè)結(jié)果如圖5所示,結(jié)果表明,2022年乳山市冬小麥種植面積為135.66萬(wàn)平方千米,合20.35萬(wàn)畝,與2022年公布的乳山市冬小麥種植面積21.56萬(wàn)畝對(duì)比,精度為94.39%。乳山市內(nèi)岠嵎山、昆崳山、垛山、馬石山、大乳山、多福山等分布在乳山西南部、東北部、西北部、南部等區(qū)域,冬小麥則均勻分布在山地以外的地方,主要集中在乳山市的中部和北部以及東南部的午極鎮(zhèn)、下初鎮(zhèn)、夏村鎮(zhèn)、育黎鎮(zhèn)等,符合乳山市的地形分布情況,總體結(jié)果比較理想。
3? 結(jié)? 論
本文以威海乳山市為研究區(qū)域,利用GF-1C、GF-6、ZY-3多源影像數(shù)據(jù),基于NDVI和深度學(xué)習(xí)方法,對(duì)冬小麥種植面積進(jìn)行提取,精度為94.39%,得出以下結(jié)論:
(1)本研究基于NDVI的冬小麥提取,將計(jì)算的NDVI值替換紅光波段,然后進(jìn)行影像合成,更加突出包括冬小麥在內(nèi)的植被信息,有利于提高信息提取的準(zhǔn)確性。
(2)深度學(xué)習(xí)技術(shù)的發(fā)展,為快速影像解譯提供了可能。本文以威海乳山市為研究區(qū)域進(jìn)行研究,樣本量相對(duì)偏少,但是深度學(xué)習(xí)訓(xùn)練模型具有成長(zhǎng)性,隨著樣本量的不斷增加以及深度學(xué)習(xí)迭代次數(shù)的增多,模型的學(xué)習(xí)效果會(huì)越來(lái)越好,提取精度也會(huì)隨之提高。
(3)為滿足研究區(qū)域內(nèi)影像質(zhì)量和覆蓋范圍的要求,選取3種類型的影像進(jìn)行提取,有利于提升預(yù)測(cè)結(jié)果的準(zhǔn)確性。多源影像豐富了模型的類型,在預(yù)測(cè)過(guò)程中具有相互的促進(jìn)作用。
同時(shí)文中研究還存在一些不足,下一步可以從以下幾個(gè)方面進(jìn)行深入研究:
(1)本研究冬小麥提取結(jié)果總體精度較好,但是在丘陵、梯田等區(qū)域的零星地塊,提取結(jié)果不太理想,主要是因?yàn)槠扑榈貕K與周邊非冬小麥地塊構(gòu)成的混合地塊無(wú)法有效識(shí)別。
(2)由于韭菜和大蒜在影像上的狀態(tài)與冬小麥類似,雖然勾畫樣本我們將其剔除,但是在預(yù)測(cè)結(jié)果中仍然出現(xiàn)誤提現(xiàn)象,需要進(jìn)一步進(jìn)行改善,將誤提的圖斑進(jìn)行剔除。
(3)在本研究的基礎(chǔ)上,后期可以探索大區(qū)域、海量樣本、多源影像的冬小麥提取。
參考文獻(xiàn):
[1] 楊蕙宇,王征強(qiáng),白建軍,等.基于多特征提取與優(yōu)選的冬小麥面積提取 [J].陜西師范大學(xué)學(xué)報(bào):自然科學(xué)版,2020,48(1):40-49.
[2] 楊閆君,占玉林,田慶久,等.利用時(shí)序數(shù)據(jù)構(gòu)建冬小麥識(shí)別矢量分析模型 [J].遙感信息,2016,31(5):53-59.
[3] 王碧晴,韓文泉,許馳.基于圖像分割和NDVI時(shí)間序列曲線分類模型的冬小麥種植區(qū)域識(shí)別與提取 [J].國(guó)土資源遙感,2020,32(2):219-225.
[4] 王曉曉,韓留生,楊驥,等.Sentinel-2與Landsat8數(shù)據(jù)組合下的多特征冬小麥面積提取 [J].測(cè)繪通報(bào),2022(3):111-115.
[5] 周亮,慕號(hào)偉,馬海姣,等.基于卷積神經(jīng)網(wǎng)絡(luò)的中國(guó)北方冬小麥遙感估產(chǎn) [J].農(nóng)業(yè)工程學(xué)報(bào),2019,35(15):119-128.
[6] 中國(guó)乳山網(wǎng).乳山概況 [EB/OL].[2022-08-01]. http://www.rushan.gov.cn/col/col51333/index.html.
[7] 陳文志,許調(diào)娟,童英良.GF-1B、C、D星數(shù)據(jù)在國(guó)土資源調(diào)查監(jiān)測(cè)領(lǐng)域的應(yīng)用研究[J].浙江國(guó)土資源,2022(3):40-43.
[8] 趙鴻飛,路釗,伊洋,等.基于GF-6的植被覆蓋度遙感估測(cè)研究 [J].測(cè)繪與空間地理信息,2022,45(3):19-23.
[9] 鄭冬梅,王海賓,夏朝宗,等.基于ZY-3衛(wèi)星多光譜影像估算浙江省喬木林地上碳密度 [J].北京林業(yè)大學(xué)學(xué)報(bào),2020,42(1):65-74.
作者簡(jiǎn)介:薛雨(1992—),女,漢族,山東濟(jì)寧人,工程師,碩士,研究方向:遙感影像智能解譯及地理信息數(shù)據(jù)處理。
收稿日期:2022-08-24