程 滔,吳 蕓,鄭新燕,楊 剛,白 駒
(1.國家基礎(chǔ)地理信息中心,北京 100830;2.中國地圖出版社,北京 100045)
隨著計算機硬件的發(fā)展與計算能力的提升,大數(shù)據(jù)計算與分析、人工智能、深度學(xué)習(xí)等先進技術(shù)取得了實質(zhì)性的快速進步[1-2],并在商品識別、人臉識別、目標(biāo)檢測、敏感圖識別、人類活動分析等實際應(yīng)用場景中發(fā)揮了重要作用[3],應(yīng)用潛力十分巨大。
基于深度學(xué)習(xí)等技術(shù)的遙感影像智能分類是近年來遙感領(lǐng)域研究的熱點[4-6]。這些技術(shù)的實質(zhì),是通過構(gòu)建具有很多隱層的機器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù)來學(xué)習(xí)更有用的特征,從而提升分類準(zhǔn)確性。因此,遙感影像智能分類需要大規(guī)模訓(xùn)練樣本和測試樣本數(shù)據(jù),并且樣本數(shù)據(jù)準(zhǔn)確度越高,通過訓(xùn)練進行識別和分類的精度就越高[7]。這里的樣本數(shù)據(jù)指遙感影像和遙感影像對應(yīng)的明確的地物目標(biāo)組成的一一對應(yīng)的關(guān)系數(shù)據(jù)組。
地理國情監(jiān)測重大專項形成的覆蓋全國范圍的高分辨率遙感影像、高精度地表覆蓋分類產(chǎn)品[8],為遙感影像智能分類海量樣本數(shù)據(jù)采集提供了豐富、可行的數(shù)據(jù)資源?;谶b感影像數(shù)據(jù)與地表覆蓋分類柵格化數(shù)據(jù),利用空間位置匹配技術(shù),構(gòu)建遙感影像與地表覆蓋分類標(biāo)簽數(shù)據(jù)對,通過大規(guī)模采集,可為遙感影像智能分類提供精確的樣本數(shù)據(jù)[9-10]。
本文針對遙感影像智能分類對高質(zhì)量、大規(guī)模樣本數(shù)據(jù)的需求,開展海量樣本數(shù)據(jù)采集方法研究,解決采集過程中的各項技術(shù)難點;同時開發(fā)樣本數(shù)據(jù)自動采集軟件。利用整套方法,完成全國尺度海量樣本數(shù)據(jù)的采集,并基于多個不同區(qū)域的采集過程與樣本數(shù)據(jù)成果,對方法的實用性、運算性能進行評估。
地理國情監(jiān)測使用的遙感影像數(shù)據(jù)空間分辨率標(biāo)準(zhǔn)為全國優(yōu)于2.5 m、重點區(qū)域優(yōu)于1 m,以資源三號測繪衛(wèi)星獲取的影像為主,其他國產(chǎn)高分辨率遙感影像(包括高分一號、高分二號、北京二號、天繪一號等)及商業(yè)衛(wèi)星遙感影像(包括WorldView-1/2、GeoEye、QuickBird、pléiade-1A/1B、SPOT 6/7等)進行補充,部分地區(qū)根據(jù)需要開展航空攝影、無人機航空攝影獲取影像。原始影像各波段位深為16 bit,分幅數(shù)字正射影像各波段位深為8 bit[11]。
地理國情監(jiān)測的標(biāo)準(zhǔn)時點為6月30日,這種多源遙感影像協(xié)同滿足地理國情監(jiān)測需求的現(xiàn)狀,使得遙感影像呈現(xiàn)傳感器類型多樣性、分辨率多樣性、時相多樣性的特點。這一特點也豐富了海量樣本數(shù)據(jù)成果的內(nèi)容,有利于智能分類兼顧更多的數(shù)據(jù)特征。
地理國情監(jiān)測地表覆蓋分類產(chǎn)品包含種植土地、林草覆蓋、房屋建筑(區(qū))、鐵路與道路、構(gòu)筑物、人工堆掘地、荒漠與裸露地、水域8個一級類、46個二級類、86個三級類,類型劃分以地物自然屬性為主要依據(jù)[12],均是基于資源三號、高分二號、WorldView-1/2等高分辨率遙感影像采集,全國范圍全覆蓋、無縫隙,采集指標(biāo)基本要求是最小圖斑對應(yīng)的地面實地面積為400 m2。該產(chǎn)品為各部門掌握地表自然資源、生態(tài)環(huán)境及人類活動基本情況提供了高精度的地表覆蓋數(shù)據(jù)基礎(chǔ)。
地理國情監(jiān)測地表覆蓋分類產(chǎn)品格式為矢量空間格式,全國范圍圖斑數(shù)量達到數(shù)億個。在開展樣本數(shù)據(jù)采集時,以縣級行政區(qū)劃為單元,對矢量數(shù)據(jù)進行了柵格化處理,柵格化粒度為1 m×1 m。采用面積最大法確定各柵格所代表的地表覆蓋類型,即柵格范圍區(qū)域內(nèi),各類型中面積占比最大的類型作為該柵格的分類類型。地表覆蓋分類產(chǎn)品的分類代碼最大為4位數(shù)字,因此柵格化結(jié)果位深定義為16 bit。
全國尺度海量樣本數(shù)據(jù)采集數(shù)據(jù)量巨大,因此,以縣級行政區(qū)劃為單元進行采集,最終聚合形成全國尺度海量樣本數(shù)據(jù)集。基于數(shù)據(jù)源特征分析,海量樣本數(shù)據(jù)采集需要研究解決縣域采集數(shù)量權(quán)重設(shè)置、坐標(biāo)投影轉(zhuǎn)換、柵格灰度重采樣、無效樣本數(shù)據(jù)過濾、地表覆蓋分類碼映射、樣本數(shù)據(jù)命名標(biāo)識、特定地表覆蓋類型樣本數(shù)據(jù)采集等關(guān)鍵技術(shù)問題,實現(xiàn)海量樣本數(shù)據(jù)采集的自動化、批量化,提升采集效率。海量樣本數(shù)據(jù)采集技術(shù)流程如圖1所示。
每個縣級行政區(qū)劃樣本采集數(shù)量采用面積因子進行自動分配,根據(jù)縣域面積與全國縣平均面積的大小關(guān)系、全國尺度需要采集的樣本數(shù)據(jù)總數(shù)量,并考慮采集過程中存在無效樣本塊的因素,分配合理的采集數(shù)量。
地理國情監(jiān)測地表覆蓋柵格數(shù)據(jù)坐標(biāo)為CGCS2000,分幅數(shù)字正射影像坐標(biāo)為CGCS2000坐標(biāo)系下的高斯-克呂格投影坐標(biāo)?;谖恢闷ヅ浼夹g(shù)的樣本數(shù)據(jù)采集是由采集的有效的地表覆蓋柵格影像塊的中心點大地坐標(biāo),計算對應(yīng)的分幅數(shù)字正射影像的圖幅號,檢索分幅數(shù)字正射影像數(shù)據(jù)文件,最后進行采集。
因此,在創(chuàng)建輸出的數(shù)字正射影像塊時,坐標(biāo)、行列數(shù)與地表覆蓋柵格影像塊保持一致;獲取到地表覆蓋柵格影像塊的中心點大地坐標(biāo)后,對輸出的數(shù)字正射影像塊進行各像素循環(huán),利用高斯正算算法進行坐標(biāo)投影轉(zhuǎn)換,從分幅數(shù)字正射影像中重采樣各像素灰度值。
地理國情監(jiān)測地表覆蓋柵格數(shù)據(jù)分辨率統(tǒng)一為1 m,分幅數(shù)字正射影像分辨率包括0.5、1、2 m 3種形式[11]。對于0.5、2 m的分幅數(shù)字正射影像,在輸出數(shù)字正射影像塊時,分辨率需要重采樣至1 m。
針對分幅數(shù)字正射影像存在3種分辨率的情況,在創(chuàng)建輸出的數(shù)字正射影像塊時,坐標(biāo)、行列數(shù)與地表覆蓋柵格影像塊保持一致;對輸出的數(shù)字正射影像塊進行各像素循環(huán),利用雙線性內(nèi)插算法從分幅數(shù)字正射影像中重采樣各像素灰度值。
2.4.1 數(shù)字正射影像無效影像塊過濾
采集數(shù)字正射影像塊時,進行灰度值統(tǒng)計判斷,統(tǒng)計像素灰度值為(0,0,0),即各波段像素灰度值均為0的像素數(shù)目。該數(shù)目大于影像塊像素總數(shù)目10%時,將該影像塊判定為無效影像塊,不進行采集。
在采集過程中,存在另外一種情況,即地表覆蓋柵格影像塊有效,但數(shù)字正射影像塊無效。對于有效的地表覆蓋柵格影像塊,在采集數(shù)字正射影像塊時,由于數(shù)字正射影像按標(biāo)準(zhǔn)分幅組織,可能剛好處于分幅數(shù)字正射影像的邊緣,因此存在0值區(qū),即數(shù)字正射影像塊無效的情況。這種地表覆蓋柵格影像塊不滿幅或數(shù)字正射影像塊不滿幅的影像塊組合均應(yīng)刪除,以保證樣本數(shù)據(jù)成果的有效性。
2.4.2 地表覆蓋柵格無效影像塊過濾
采集地表覆蓋柵格影像塊時,進行灰度值判斷,只要存在像素灰度值為0的情況,則說明該影像塊存在無值區(qū),不進行采集。
為便于樣本數(shù)據(jù)應(yīng)用,并減少數(shù)據(jù)量,地表覆蓋柵格影像塊與數(shù)字正射影像塊均輸出為8 bit。由于原始地表覆蓋柵格數(shù)據(jù)為16 bit,因此,需要將其自動轉(zhuǎn)換為8 bit。
轉(zhuǎn)換方法為:創(chuàng)建TXT文本格式的索引文件,索引值為16 bit分類碼和對應(yīng)的8 bit分類碼值,針對采集的地表覆蓋柵格影像塊,根據(jù)其原始16 bit分類碼,映射得到其8 bit分類碼,并作為輸出結(jié)果值。
采集的地表覆蓋柵格影像塊與數(shù)字正射影像塊均輸出為JPG格式,不帶空間坐標(biāo)。數(shù)據(jù)命名標(biāo)識規(guī)則為:地表覆蓋柵格影像塊和對應(yīng)的數(shù)字正射影像塊文件命名標(biāo)識一致,由38位字符組成,包含縣級行政區(qū)劃代碼、數(shù)字正射影像波段數(shù)、原始遙感影像獲取時間、采集的樣本塊中心點經(jīng)度坐標(biāo)、采集的樣本塊中心點緯度坐標(biāo)(用度分秒表示,精度至0.001″)5項信息。具體為:第1—6位字符為6位縣級行政區(qū)劃代碼(反映樣本數(shù)據(jù)的空間地域);第7位字符為數(shù)字正射影像波段數(shù);第8—15位字符為原始遙感影像獲取時間(從分幅數(shù)字正射影像元數(shù)據(jù)中獲取);第16—25位字符為采集的樣本塊中心點經(jīng)度坐標(biāo);第26—34位字符為采集的樣本塊中心點緯度坐標(biāo);第35—38位字符為文件后綴名.jpg。例如:1301013201609190980202333360202333.jpg。
從分幅數(shù)字正射影像元數(shù)據(jù)中獲取原始遙感影像獲取時間時,分為3種情況:①航空攝影影像數(shù)據(jù),讀取“航攝時間”字段,只有年、月6位字符,第8—15位字符用“0”補齊至8位,如20160900。②衛(wèi)星影像數(shù)據(jù),首選讀取“多光譜衛(wèi)星影像獲取時間”字段,有年、月、日8位字符,如20160919;如果該字段值為空,則讀取“全色衛(wèi)星影像獲取時間”字段,有年、月、日8位字符,如20160919。③如果讀取這3個字段,獲取的值均為空,則第8—15位字符用“0”補齊至8位。
樣本數(shù)據(jù)大規(guī)模位置匹配采集是以縣級行政區(qū)劃為單元,以地表覆蓋柵格數(shù)據(jù)為主線,通過規(guī)則格網(wǎng)劃分進行的,那么采集結(jié)果就可能出現(xiàn)部分地表覆蓋類型采集的樣本數(shù)目較多、部分地表覆蓋類型采集出的樣本數(shù)目較少甚至沒有的情況。同時,部分地表覆蓋類型需要采集到純凈的單一地表覆蓋類型的樣本數(shù)據(jù)。
針對這種需求,本文采用的方法具體如下:自定義一個TXT文本格式的采集參數(shù)文件,將相關(guān)信息錄入TXT文本文件中,包括批采集數(shù)量、特定地表覆蓋類型樣本數(shù)據(jù)的分類代碼、采集的樣本塊中心點經(jīng)度坐標(biāo)、采集的樣本塊中心點緯度坐標(biāo)、樣本塊列數(shù)、樣本塊行數(shù),各列之間用tab鍵或空格分開。通過讀取采集參數(shù)文件,實現(xiàn)相應(yīng)樣本數(shù)據(jù)的采集,即可滿足這種特定需求。
面向遙感影像智能分類的海量樣本數(shù)據(jù)規(guī)模巨大,目前商業(yè)軟件難以滿足采集效率需求。針對這一現(xiàn)狀,本文自主研發(fā)了柵格空間數(shù)據(jù)大規(guī)模位置匹配采集軟件——LCARasterTile,根據(jù)地理國情監(jiān)測高分辨率遙感影像及高精度地表覆蓋分類產(chǎn)品的數(shù)據(jù)管理方式、數(shù)據(jù)量等特點,按照全國各縣面積大小,設(shè)置合理的采集參數(shù),利用空間位置匹配技術(shù)實現(xiàn)全國尺度海量樣本數(shù)據(jù)采集,提高數(shù)據(jù)采集效率,滿足面向遙感影像智能分類的海量樣本數(shù)據(jù)需要。
LCARasterTile軟件是在Visual Studio 2010集成開發(fā)環(huán)境中,利用Microsoft Visual C++語言實現(xiàn)的。開發(fā)過程中,調(diào)用了GDAL(geospatial data abstraction library)開源柵格空間數(shù)據(jù)轉(zhuǎn)換庫[13]。
LCARasterTile軟件操作簡便,實現(xiàn)了大規(guī)模柵格空間數(shù)據(jù)的自動化、批量化位置匹配采集,提高了數(shù)據(jù)采集效率,保證了樣本數(shù)據(jù)集產(chǎn)品質(zhì)量,并節(jié)約了人力、物力成本。
軟件主要具有以下幾個特點:①軟件支持大數(shù)據(jù)的輸入、讀取與處理;②軟件可根據(jù)遙感影像智能分類對樣本影像塊尺寸需求,設(shè)置不同的采集尺寸;③軟件能夠?qū)崿F(xiàn)無效樣本數(shù)據(jù)的自動過濾;④針對特定地表覆蓋類型樣本數(shù)據(jù)采集需求,軟件可進行特定模式采集;⑤軟件具有批處理功能,數(shù)據(jù)處理效率高;⑥軟件界面友好,操作簡便。
軟件輸入數(shù)據(jù)包括3項:
(1)地理國情監(jiān)測地表覆蓋柵格數(shù)據(jù)。數(shù)據(jù)文件采用IMG(后綴名為“.img”)格式,經(jīng)緯度坐標(biāo);多個數(shù)據(jù)文件存儲在同一個文件夾中,便于進行批處理操作。
(2)數(shù)字正射影像數(shù)據(jù)。數(shù)據(jù)文件采用非壓縮的TIFF格式(后綴名為“.tif”),高斯-克呂格投影坐標(biāo);影像坐標(biāo)信息文件采用TIFF WORLD文檔格式(后綴名為“.tfw”);數(shù)據(jù)文件與影像坐標(biāo)信息文件的文件命名標(biāo)識一致;多個數(shù)據(jù)文件存儲在同一個文件夾中,便于進行批處理操作。
(3)采集參數(shù)數(shù)據(jù)。在進行特定地表覆蓋類型樣本數(shù)據(jù)采集時,還需要輸入TXT格式采集參數(shù)數(shù)據(jù);記錄內(nèi)容包括:批采集數(shù)量、特定地表覆蓋類型樣本數(shù)據(jù)的分類代碼、采集的樣本塊中心點經(jīng)度坐標(biāo)、采集的樣本塊中心點緯度坐標(biāo)、樣本塊列數(shù)、樣本塊行數(shù)。在進行大規(guī)模采集時,采集參數(shù)只需輸入采集尺寸,默認(rèn)值為1023,即采集列數(shù)、采集行數(shù)均為1023個像素。
軟件輸出成果為位置匹配的遙感影像數(shù)據(jù)與分類標(biāo)簽數(shù)據(jù)組成的樣本數(shù)據(jù)對,均為JPG格式,兩者命名標(biāo)識一致,存儲在不同的路徑下,并一一對應(yīng)。
利用本文方法,基于LCARasterTile軟件,以縣級行政區(qū)劃為單元,實現(xiàn)了全國尺度海量樣本數(shù)據(jù)采集??紤]面積、形狀等因素,本文選取湖北省武漢市5個縣級行政區(qū)劃作為樣例區(qū),利用其成果,對整套方法的實用性及軟件運算性能進行評估。
樣例區(qū)包括武漢市漢南區(qū)、蔡甸區(qū)、江夏區(qū)、黃陂區(qū)、新洲區(qū)。
采集到的單個位置匹配的遙感影像數(shù)據(jù)與分類標(biāo)簽數(shù)據(jù)組成的樣本數(shù)據(jù)對如圖2所示,幅面大小為1023 m×1023 m。其中,圖2(a)為遙感影像數(shù)據(jù)(即數(shù)字正射影像影像塊),圖2(b)為分類標(biāo)簽數(shù)據(jù)(即地表覆蓋柵格影像塊),其像素灰度值代表對應(yīng)的地表覆蓋分類碼。
各縣級行政區(qū)劃樣本數(shù)據(jù)采集統(tǒng)計信息見表1,通過采用單個大數(shù)據(jù)分塊、整體數(shù)據(jù)分批循環(huán)處理算法,進行合理的內(nèi)存分配,解決了數(shù)據(jù)運行效率與計算性能問題[14]。表1為單臺計算機、單線程數(shù)據(jù)計算效率,在采集過程中,計算機內(nèi)存占用為300~520 MB(計算機為Windows 7 64位操作系統(tǒng),32 GB內(nèi)存,1.9 GHz處理器)。
表1 樣本數(shù)據(jù)采集統(tǒng)計信息
從表1可以看出,縣域面積、形狀各不同,采集到的樣本數(shù)據(jù)數(shù)目、密度存在一定差異。根據(jù)表1,采用單臺計算機、單線程,全國尺度采集300萬量級的樣本數(shù)據(jù)對,需要66 d;如果采用5臺計算機、多線程采集,5 d可完成采集,能夠滿足全國尺度采集效率需求。
(1)本文構(gòu)建了面向遙感影像智能分類的海量樣本數(shù)據(jù)采集方法、采集軟件一整套技術(shù)體系,解決了海量樣本數(shù)據(jù)采集中的技術(shù)問題。自主研發(fā)的LCARasterTile軟件,滿足了樣本數(shù)據(jù)大規(guī)模采集與特定地表覆蓋類型采集需求,保證了海量樣本數(shù)據(jù)質(zhì)量,提升了采集效率。
(2)本文將地理國情監(jiān)測高分辨率遙感影像及高精度地表覆蓋分類產(chǎn)品作為數(shù)據(jù)源,構(gòu)建了位置匹配的遙感影像數(shù)據(jù)與分類標(biāo)簽數(shù)據(jù)組成的樣本數(shù)據(jù)對,解決了目前高精度且具有標(biāo)注信息的樣本數(shù)據(jù)不足的問題。
(3)本文利用提出的一整套方法,實現(xiàn)了全國尺度海量樣本數(shù)據(jù)采集,滿足了遙感影像智能分類對高質(zhì)量、大規(guī)模樣本數(shù)據(jù)的需求,具有實際意義。采集的全國尺度海量樣本數(shù)據(jù)已應(yīng)用于遙感影像智能分類研究中,并取得了一定的成果,后續(xù)將進一步拓展應(yīng)用范圍。