張定祥,安 瓊,季宏偉,武建佳,李士江
(1. 中國國土勘測規(guī)劃院,北京100035;2. 北京博信高科信息技術有限公司,北京100029)
通過多年土地調查工作,全國范圍的土地利用及變化數據資源不斷積累,土地數據的挖掘分析需求日益旺盛。各地針對土地利用變化數據的挖掘分析工作不斷深入,借助專業(yè)軟件已經積累一些土地利用數據可視化展示方式。但是,目前土地利用現狀及變化數據的展現形式大多停留在傳統(tǒng)的專題圖(專題統(tǒng)計地圖)、統(tǒng)計表(表格)、統(tǒng)計圖(餅圖、折線圖)方式,這些展示方式可以直觀反映出土地資源的現狀和變化情況,但是展示交互性、直觀性仍有一定局限。特別是對于多年土地利用數據的時間特征、空間特征,傳統(tǒng)的專題圖、統(tǒng)計圖展示方式均不能動態(tài)展示,無法直觀地展現土地利用數據的變化特點。土地利用現狀及變化數據在空間維、時間維、動態(tài)流媒體可交互展示方面研究和應用仍然較少。
隨著Hadoop大數據并行技術的推進,一系列新型展示方式逐步出現,并在其他領域進行了應用,取得了良好效果,創(chuàng)新地展示方式極大的提升了數據的易讀性,使得數據的價值能夠快速被讀者接受?;诖?,土地利用數據的直觀表達需要借鑒其他領域數據的可視化表達方式,研究篩選適合土地利用現狀及變化數據可視化表達的形式,為海量數據資源分析挖掘結果的直觀展示積累技術。文章將結合土地利用變化數據的特點和應用需求,以土地利用現狀及變化直觀表達為目標,通過借鑒其他領域數據的可視化表達方式,研究適合土地利用數據可視化表達的形式,進而提升土地基礎數據的決策支撐能力,帶動新的展示技術在土地行業(yè)中的廣泛應用。
根據土地利用變化數據特點以及可視化需求,該文提出了土地利用數據可視化展示的總體設計流程,如圖1所示。土地利用變化數據的展示總體流程可以概括為數據標準化處理、數據分析處理和可視化展示3個步驟。
圖1 總體設計流程Fig.1 Overall design flow
數據標準化是指將現有的各類土地利用變化數據和相關的基礎地理數據,根據分析需求進行處理,將高維度、高空間精度、高時間精度的數據進行降維和標準化處理。通過預處理,可以將海量數據匯總為數量較小但不影響宏觀分析展示的數據集合。例如,在預處理過程中,可以將全國土地利用圖數據進行匯總,形成全國范圍的1分網格數據(長寬均為1分的正方形);或者按照用地類型,匯總為不同時間維度、不同地類的總量數據。
數據分析處理是指將標準化數據,根據展示需求進行二次計算,生成可以快速實現數據可視化的底層數據結構,如將多年地類面積數據轉換為按年度關聯(lián)的流向數據模型,或將不同網格內新增加建設用地面積數據轉換為以網格為中心點、以用地面為高度的三維數據模型。
數據可視化展示是指將計算的數據進行渲染,并通過程序語言實現可以交互操作的、直觀化的圖像表達方式。該文圍繞土地利用數據的特點,針對土地數據分析展示過程中的時序展示、空間展示、流向變化展示三方面的需求,設計了多年土地利用流向圖、多年地類圖斑變化視頻、三維立體圖3種有代表性的展示方法,并針對土地利用數據量大,處理時間長的問題,設計了基于Hadoop并行計算技術的快速數據預處理方法。
流向數據可視化展示模型基于土地利用變化指標動態(tài)變化的特點,實現對土地利用變化情況直觀展示分析。變化情況流量流向分析主要適用于土地利用現狀調查數據、土地利用規(guī)劃數據以及耕地數據等年度變更數據[1]。進行多年數據變化流量流向分析,首先對任意兩年的現狀數據進行疊加、計算,形成新的年度變化數據;其次按照三大類、一級類、二級類或其他分析分類要求進行匯總,循環(huán)疊加處理后的數據通過可視化預處理,形成數據文件,通過前臺可視化展示組件進行展示。具體技術路線如圖2所示。土地利用變化流向圖,可量化展示不同時間的土地利用數據在不同類型間的變化情況[2]。
圖2 土地變化流向數據可視化展示技術路線Fig.2 Technical route of visualization of land change flow data
土地利用空間變化數據視頻化表達模型主要針對土地利用變化數據多年度時序變化的特點,利用Hadoop大數據并行處理技術,結合空間數據計算,快速提取多年度土地變化圖形,將變化情況平均等分成多楨,并利用GIS要素渲染技術,渲染為圖片,繼而利用視頻技術,以視頻的形式展示多年空間數據時序動態(tài)變化[3]。多年土地利用空間數據時序變化視頻展示將多年的地圖文件按照國家、省、市縣3種類型進行數據處理,其中全國范圍的按行政區(qū)聚合并計算各地類面積及百分比,再與遙感圖層疊加并繪制地圖,轉換為數據文件后進行并行繪制,最終形成視頻展示文件。具體技術路線如圖3所示。
圖3 土地利用空間變化數據視頻化展示技術路線Fig.3 Technical route for video presentation of land-use spatial change
指標數據三維立體化表達模型主要是基于土地利用變化統(tǒng)計數據產品數據量大、數據格式較為規(guī)范統(tǒng)一、便于計算等優(yōu)勢,針對數據指標空間化展現、動態(tài)變化等特點,并借鑒其他領域的三維立體化展示方法,采用“三維地球”模型進行量化展示[4]。從空間數據維度而言,三維立體化展示方法可用于分析行政區(qū)空間統(tǒng)計數據、空間網格統(tǒng)計數據以及空間點位統(tǒng)計數據;從數據類型而言,可分析土地管理類統(tǒng)計數據,以及與土地相關的人口、GDP等社會經濟數據;從數據指標而言,可分析例如農用地面積、建設用地面積、未利用地面積、國有土地面積、集體土地面積、土地供應面積、土地儲備面積、地類分布面積等土地核心指標,以及與人口、時序值、社會經濟數據等疊加計算形成的人均值、變化量、變化幅度等衍生指標。
對于大范圍的地圖文件,按照行政區(qū)進行聚合,劃分網格,按網格進行統(tǒng)計數據的均一化處理;對于市縣等小范圍地圖文件,則直接進行數據均一化處理、格式轉換,由此形成三維可視化展示效果。具體技術路線如圖4所示。三維立體展示中以虛擬的三維地球為載體,以柱狀圖展示某一主題的量度,各類統(tǒng)計數據可按照行政區(qū)劃、空間網格或點位信息進行三維空間的數據展示[5]。
圖4 網格指標數據三維立體化表達技術路線Fig.4 Technical route for three-dimensional representation of grid index data
基于上述提出的系統(tǒng)模型和數據可視化表達技術路線,本文實現了相關的數據處理模型、算法,研發(fā)了可視化展示工具,下面對各個可視化展示方法的實現及其效果進行介紹。
土地利用變化流量流向圖以用地類型為分析維度,通過不同的色塊表示各地類,以連線表示地類間的流向,即某一地類分別流向其他地類的情況;以連線的寬度代表地類的流量,即線條越寬,地類流量越大,線條越窄,地類流量越?。?]。流量流向圖為動態(tài)的展示圖,當鼠標移動到某地類流量流向圖上時,會突出顯示該地類具體流向線以及實際的流量數據,同時,利用數據列表,明確地展示地類的流向與流量。以選取的某試點區(qū)2013年初至2014年末土地利用現狀數據一級地類、二級地類流向圖為例展示土地利用變化情況流向圖。具體如圖5~6所示。2013年、2014年該區(qū)土地利用變化流量流向圖中,左側為2013年初各地類面積,中間代表2013年末各地類面積,右側為2014年末各地類面積,從線條寬度變化可以看出此階段各地類的變化情況,同時通過線條的連接方向,可以直觀地展示各地類的流向情況。
圖5 2013年和2014年土地利用變化一級地類流向Fig.5 Flow maps of land-use change of first-level types in 2013 and 2014
圖6 2013年和2014年土地利用變化二級地類流向Fig.6 Flow maps of land-use change of second-level types in 2013 and 2014
以2007—2013年北京市土地利用現狀數據為例,利用Hadoop并行運算環(huán)境對多年土地利用變化數據進行多級柵格化、圖像視頻合成等處理步驟,生動展示了北京市土地利用現狀建設用地、農用地、未利用地三大類數據空間分布變化情況,具體如圖7所示。2007—2013年北京市土地利用現狀變化視頻中,用不同的色塊代表不同的地類,當視頻播放時,代表建設用地、農用地、未利用地的色塊在不停地變換位置,直觀的展現了全市多年間建設用地、農用地、未利用地的連續(xù)變化情況,從圖7中可以看出,多年間建設用地持續(xù)增加的趨勢與農用地、未利用地不同階段的變化情況。
圖7 2007—2013年北京市土地利用變化Fig7 Video Map of Land Use Change in Beijing from 2007 to 2013
借助Hadoop并行運算環(huán)境,對經過網格化處理的空間統(tǒng)計數據進行多年度、多行政區(qū)快速疊加聚合,再通過計算網格土地利用面積變化比和網格土地利用程度,以三維地球為載體展現各個網格的用地情況[7],具體公式為:
①網格土地利用面積變化比
式(1)中,表示網格中第個地類在年的土地面積,是網格內地類數,網格面積是該網格的土地總面積。
②網格土地利用程度
提前設定好各地類的用地程度系數,具體地類的土地利用程度計算公式為:
式(2)中,表示網格中第個地類在年的土地面積,是網格內地類數,是第個地類的用地程度權重,網格面積是本網格的土地總面積。其計算結果如表1所示。
表1 不同類型土地用地程度分級指數表Table 1 Classification index for different types of land use
土地利用變化比和土地用地程度均可以三維地球為載體展示。這里以2010年全國10分網格的土地用地程度為例,按照以上技術路線進行數據處理分析,展示全國網格的土地利用程度,具體如圖8所示。
圖8 2010年全國土地利用程度3D可視化Fig.8 3D visualizations of Chinese land use levels in 2010
2010年全國10分網格的土地用地程度三維展示圖中,通過柱狀圖來表示土地利用程度,柱子越高代表土地利用程度越大,柱子越密集代表土地開發(fā)程度越大。用戶可以通過參數選擇實時調整柱子高度,并可以進行單個立方柱的數值查詢。
該研究基于土地利用管理實際業(yè)務,探索了多種新的土地基礎數據展示方式,證明可以將主流熱門技術與現有土地基礎數據相結合,滿足大數據挖掘分析的直觀可視化表達的需求。同時,該項目形成的可視化控件成果為下一步開展深入分析研究和技術擴展提供了良好的基礎。Hadoop并行運算環(huán)境為進一步豐富了土地數據可視化分析展示手段準備了條件。但總體來看,目前土地利用變化可視化模型設計、組件研發(fā)還是初級的,下一步將擴展可視化展示模型,同時提升數據處理效率,進一步優(yōu)化組件展示效果,實現基于海量數據的實時可視化展示。