白 冰盧 闖羅玉柱彭秀媛
(遼寧省農(nóng)業(yè)科學(xué)院信息研究所,遼寧 沈陽 110161)
設(shè)施產(chǎn)業(yè)作為遼寧省農(nóng)業(yè)的主要產(chǎn)業(yè)和優(yōu)勢產(chǎn)業(yè),目前仍存在日光溫室數(shù)量和面積數(shù)據(jù)不精準(zhǔn)問題,利用遙感技術(shù)快速、準(zhǔn)確地獲取遼寧省日光溫室數(shù)量、面積、位置等信息,監(jiān)測遼寧省溫室的空間分布和動態(tài)變化情況,可為政府、合作社、農(nóng)戶等進行設(shè)施生產(chǎn)管理及規(guī)劃、設(shè)施生產(chǎn)決策制定等提供數(shù)據(jù)支撐。 目前,溫室數(shù)量、面積等數(shù)據(jù)的獲取多采用抽樣調(diào)查和統(tǒng)計上報等方法,由于其工作流程復(fù)雜、人工干預(yù)過多等問題,導(dǎo)致數(shù)據(jù)獲取的準(zhǔn)確性和時效性較低。 相比于傳統(tǒng)統(tǒng)計方法,遙感技術(shù)可以在大范圍、大尺度上快速獲取相關(guān)信息,且遙感圖像數(shù)據(jù)已用于溫室信息獲取應(yīng)用[1]。 其中,主要采用的目視解譯法雖精度較高,但費時費力,難以完成長時間序列、大空間尺度的溫室識別和監(jiān)測工作[2]。 隨著機器學(xué)習(xí)、云計算等前沿技術(shù)的發(fā)展,使得長時間、大范圍、高精度的溫室信息自動提取成為可能,并逐漸成為解決此類問題的重要手段[3]。
采用2019年GF-2 衛(wèi)星數(shù)據(jù)作為數(shù)據(jù)源(圖1 所示),數(shù)據(jù)主要以夏季遙感數(shù)據(jù)為主,秋季遙感數(shù)據(jù)作為補充。 包括高分2 號數(shù)據(jù)869 景,其中2019年度758 景,空間分辨率0.8 m,平原區(qū)平面位置精度5 m,高山區(qū)平面位置精度25 m,正射校正采用的DEM 分辨率為30 m。
圖1 高分遙感數(shù)據(jù)
1.2.1 最優(yōu)切片尺寸確定
待分析高分圖像數(shù)據(jù)量2.69T,而圖形處理器(Graphic Processing Unit,GPU)顯存一般為24 G 大,因此不能一次性將圖像導(dǎo)入GPU 中進行分析,需將數(shù)據(jù)切片分析,因此本研究擬選取不同的尺寸標(biāo)準(zhǔn)將圖像數(shù)據(jù)分割成碎片,分析截斷率進而確定最優(yōu)切片尺寸,解決數(shù)據(jù)量過大而不能分析的問題,也便于圖像數(shù)據(jù)標(biāo)注和分析。
1.2.2 進行高分圖像數(shù)據(jù)增強和顏色校準(zhǔn)
由于待分析高分?jǐn)?shù)據(jù)存在涉及區(qū)域大、數(shù)據(jù)采集時間不一致等問題,使得圖像數(shù)據(jù)顏色不遵循同一基準(zhǔn),造成圖像數(shù)據(jù)在多維空間中可能存在同一特征但Mahalanobis 距離不相等的問題[4]。 且由于不同地域不同用途的日光溫室形態(tài)特征相差很大,而日光溫室邊界與周圍環(huán)境顏色相近。 因此本研究將不同區(qū)域圖像數(shù)據(jù)進行數(shù)據(jù)增強和顏色校準(zhǔn)。
1.2.3 日光溫室識別模型構(gòu)建
本研究選用Segnet、Deeplab v3+、Unet3個語義分割模型進行識別模型構(gòu)建研究[5~7]。 根據(jù)公式(1)可知,在訓(xùn)練誤差相同的情況下,模型的復(fù)雜度越低,模型的泛化能力就越強。
式中R(ω)為權(quán)重函數(shù),稱為置信范圍,與樣本數(shù)N成反比,與算法相關(guān)的VC維參數(shù)成h正比。
由于選用的3 種模型的復(fù)雜度及架構(gòu)不同,本研究擬對3 種模型進行實驗并改良,將3個模型通過凍結(jié)層分析模型中的每一層后進行改進,之后通過模型融合綜合判定每個像素點的歸屬類別,進一步提高識別的準(zhǔn)確率。最后將識別后的所有切片圖像數(shù)據(jù)采用閉操作完成識別結(jié)果的拼接,同時統(tǒng)計出溫室的數(shù)量、面積、位置等信息。
選取320×320、384×384、512×512 3 種像素尺寸將圖像數(shù)據(jù)分割成切片,通過分析截斷率確定最優(yōu)切片尺寸為384×384。
將不同區(qū)域圖像數(shù)據(jù)進行數(shù)據(jù)增強,并進行顏色校準(zhǔn),降低圖像數(shù)據(jù)及溫室特征的復(fù)雜度,盡可能的使相同特征的樣本在同一超球體內(nèi)(圖2)。
圖2 高分圖像數(shù)據(jù)增強和顏色校準(zhǔn)
根據(jù)遼寧省不同地域溫室的特征挑選了1 000 余張樣本,包括不同形態(tài)、大小的日光溫室,對選定圖像數(shù)據(jù)進行人工標(biāo)注后應(yīng)用Segnet、Deeplab v3+、Unet 3個語義分割型卷積神經(jīng)網(wǎng)絡(luò)模型進行建模,結(jié)果如表1 所示。
表1 不同模型指標(biāo)評價
通過對比3個模型的性能指標(biāo)可知:Unet 模型準(zhǔn)確率最高,Deeplab v3+模型準(zhǔn)確度(Intersection over Union,IoU)最高。 結(jié)果表明試驗中無某一模型在各方面指標(biāo)上都表現(xiàn)最好,為進一步提高識別的準(zhǔn)確率,結(jié)合3 種模型各自的優(yōu)勢,采用模型融合的方式對溫室樣本進行分類研究。
選用GF-2 影像400 張進行模型融合效果測試,結(jié)果表明融合模型識別日光溫室效果較單一模型效果好,通過目視解譯可知與實際情況吻合程度較高,評價指標(biāo)為:召回率為97.8,準(zhǔn)確率為96.4,IOU 為92.2(圖3)。
圖3 日光溫室識別融合模型效果
本研究選擇空間分辨率高、紋理信息豐富的GF-2 影像數(shù)據(jù)為研究數(shù)據(jù)源,采用了圖像校準(zhǔn)、數(shù)據(jù)增強、卷積神經(jīng)網(wǎng)絡(luò)模型、模型融合、閉操作等方法構(gòu)建了日光溫室識別模型,能夠識別遼寧省日光溫室,同時統(tǒng)計出溫室的數(shù)量、面積、位置等信息。 經(jīng)初步分析模型識別效果較好,能夠科學(xué)量化遼寧省日光溫室情況,從而為相關(guān)工作提供數(shù)據(jù)支撐。 下一步將嘗試采用多點目視解譯法進一步確定現(xiàn)有模型的準(zhǔn)確定和存在的問題,同時試驗其他數(shù)據(jù)源和圖像處理方法,以及進一步優(yōu)化現(xiàn)有日光溫室識別方法,不斷提高模型的準(zhǔn)確性。