張昕
(廣西交通設(shè)計集團有限公司 廣西南寧 530029)
測繪地理信息數(shù)據(jù)在國民經(jīng)濟建設(shè)發(fā)展中發(fā)揮著重要的作用,是地方資源調(diào)查、宏觀規(guī)劃、工程建設(shè)以及構(gòu)建數(shù)字城市等工作的基礎(chǔ)。測繪地理信息數(shù)據(jù)的采集是以測繪學(xué)為基礎(chǔ),通過對自然地理要素或者地表人工設(shè)施的形狀、大小、空間位置及其屬性等進行定量測定后,將形成的數(shù)據(jù)資源存入到測繪地理信息系統(tǒng)之中的過程。從過去的紙質(zhì)地圖,到現(xiàn)如今的網(wǎng)絡(luò)地圖、手機導(dǎo)航以及未來的自動駕駛技術(shù),都離不開測繪地理信息數(shù)據(jù)成果的技術(shù)支撐。因此,測繪數(shù)據(jù)資源已成為國民經(jīng)濟數(shù)據(jù)中極為重要的基礎(chǔ)性和戰(zhàn)略性資源,能夠為各級政府部門、各行業(yè)以及社會公眾等提供重要的數(shù)據(jù)支撐和服務(wù)[1]。
隨著計算機技術(shù)在各行各業(yè)不斷的深入運用,大數(shù)據(jù)已給我們的生活帶來了越來越多的福利,幫助各行各業(yè)向著自動化、智能化的方向發(fā)展。但目前測繪成果的開放利用程度與國民經(jīng)濟發(fā)展的信息化需求相比,仍然存在一定的差距。因此,將海量的測繪地理信息數(shù)據(jù)轉(zhuǎn)變?yōu)榭晒┤藗兪褂玫臏y繪地理信息服務(wù),是測繪地理信息發(fā)展的趨勢,也對大數(shù)據(jù)技術(shù)在測繪地理信息專業(yè)中的運用提出了更高的要求[2]。
(1)數(shù)據(jù)量龐大、難以存儲
地理信息要素的數(shù)據(jù)采集,從最早期點、線、面的簡單三維,到現(xiàn)在一比一仿真的三維彩色點云,模型內(nèi)容越來越豐富,數(shù)據(jù)大小的量級也發(fā)生了從KB到PB的變化。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫由于在非結(jié)構(gòu)化數(shù)據(jù)存儲方面存在先天不足,難以存儲和處理海量的測繪數(shù)據(jù),導(dǎo)致測繪成果長期保管和利用的需求無法滿足。
(2)測繪數(shù)據(jù)更新速度慢
由于測繪地理信息數(shù)據(jù)的采集,往往需要技術(shù)人員到野外進行實地勘測,原始測繪數(shù)據(jù)需要人工管理、保存,容易在野外發(fā)生丟失、損壞。另一方面,由于信息傳遞效率低,原始測繪數(shù)據(jù)無法及時移交內(nèi)業(yè)處理,導(dǎo)致測繪數(shù)據(jù)更新周期長,開放給社會公眾利用的測繪成果往往現(xiàn)勢性較差,已不能滿足社會高速發(fā)展的需要。
(3)缺乏共建共享機制
由于測繪地理信息數(shù)據(jù)通常具有涉密的特性,導(dǎo)致大量的測繪成果往往局限于個別政府職能部門內(nèi)部使用,難以實現(xiàn)數(shù)據(jù)的融合與共享。數(shù)據(jù)共享機制的缺乏,使得重復(fù)測繪和信息孤島的現(xiàn)象仍大量發(fā)生,不僅浪費了財政資金,同時也極大的限制了測繪成果服務(wù)社會化公共事業(yè)的能力。
(4)測繪資源分散,成果利用效率低
由于測繪地理信息資源過于分散,缺乏統(tǒng)一管理,導(dǎo)致測繪成果匯交制度難以執(zhí)行到位。加之缺少測繪地理信息數(shù)據(jù)存儲標準,不同測繪單位的成果數(shù)據(jù)不兼容、格式不統(tǒng)一、坐標系不一致、編碼不規(guī)范等問題仍普遍存在,測繪成果之間數(shù)據(jù)交換、協(xié)同開發(fā)利用的效率仍然較低。
測繪地理信息數(shù)據(jù)管理中存在的問題,歸根到底是因為傳統(tǒng)的數(shù)據(jù)管理和應(yīng)用手段無法滿足當下人們對測繪地理信息數(shù)據(jù)深入利用的需求。因此需要運用現(xiàn)代數(shù)據(jù)管理技術(shù),從基礎(chǔ)設(shè)施層、數(shù)據(jù)層、應(yīng)用層三個層次,以及標準規(guī)范體系建設(shè)等方面著手建立測繪地理信息大數(shù)據(jù)平臺。運用大數(shù)據(jù)強大的共享及運算能力,可以有效地解決測繪地理信息數(shù)據(jù)存儲難、共享難、利用難等諸多問題,實現(xiàn)測繪成果向社會公共事業(yè)服務(wù)的轉(zhuǎn)型,其整體架構(gòu)設(shè)計如圖1所示。
(1)基礎(chǔ)設(shè)施層
基礎(chǔ)設(shè)施層應(yīng)以開放和云化為原則,向上層應(yīng)用提供虛擬計算、文件存儲、數(shù)據(jù)庫、負載均衡等基礎(chǔ)設(shè)施的軟硬件和網(wǎng)絡(luò)服務(wù),是整個大數(shù)據(jù)平臺當中的基石。由于測繪地理信息數(shù)據(jù)中包含各式各樣的結(jié)構(gòu)化、非結(jié)構(gòu)化以及半結(jié)構(gòu)化的數(shù)據(jù),因此基礎(chǔ)設(shè)施層需要支持關(guān)系型數(shù)據(jù)庫、非關(guān)系型數(shù)據(jù)庫、文件數(shù)據(jù)庫的混合存儲,并具備將原始測繪數(shù)據(jù)匯聚形成數(shù)據(jù)湖的能力,為測繪地理信息數(shù)據(jù)從采集到存儲加工,再到最后的分析應(yīng)用提供保障[3]。
圖1 測繪地理信息大數(shù)據(jù)平臺整體架構(gòu)圖
(2)數(shù)據(jù)層
數(shù)據(jù)層負責(zé)將各類測繪地理信息數(shù)據(jù)進行存儲與管理,主要包含數(shù)據(jù)源層、數(shù)據(jù)整理層,以及數(shù)據(jù)存儲層三個層級。數(shù)據(jù)源層包含各類數(shù)據(jù)庫中保存的公路、水系、居民地、行政界限、自然地理要素等數(shù)據(jù),是大數(shù)據(jù)平臺的數(shù)據(jù)產(chǎn)生機構(gòu);數(shù)據(jù)整理層包括數(shù)據(jù)清洗、數(shù)據(jù)加工、數(shù)據(jù)預(yù)處理、數(shù)據(jù)加載、數(shù)據(jù)抽取等工作,將關(guān)系型數(shù)據(jù)庫中的原始測繪點、線、面數(shù)據(jù)向空間大數(shù)據(jù)池進行集成轉(zhuǎn)換;數(shù)據(jù)存儲層中存儲了整理后的數(shù)據(jù),包含各類數(shù)據(jù)集市和主題數(shù)據(jù)庫,可直接對接應(yīng)用系統(tǒng),滿足各類應(yīng)用的數(shù)據(jù)提取需求。
(3)應(yīng)用層
應(yīng)用層應(yīng)根據(jù)測繪行業(yè)特點,對數(shù)據(jù)層提供的測繪地理信息數(shù)據(jù)再次進行加工整合,建立適用于各類應(yīng)用系統(tǒng)的數(shù)據(jù)統(tǒng)計分析模型。該層需要通過Web方式向測繪行業(yè)人員以及社會公眾提供在線數(shù)據(jù)采集、實時數(shù)據(jù)查詢、計算、智能報表等多種服務(wù),并提供豐富的接口供第三方系統(tǒng)集成調(diào)用。應(yīng)用層還需要具備較強的可伸縮性和可擴展性,能夠快速響應(yīng)用戶需求,并按需增減各類測繪數(shù)據(jù)服務(wù)。例如通過利用空間數(shù)據(jù)信息構(gòu)建的“數(shù)字城市”模型,可以擴大城市建設(shè)范圍,為城市發(fā)展提供更多可利用的空間。
(4)標準規(guī)范體系
測繪地理信息大數(shù)據(jù)平臺建設(shè)的意義在于將各類測繪地理信息數(shù)據(jù)加工整合后,提取更多的數(shù)據(jù)內(nèi)在價值。但如果各類數(shù)據(jù)格式不統(tǒng)一,選用的基準物不一致、將增加較大的數(shù)據(jù)清洗、整理、入庫難度,不利于數(shù)據(jù)的使用和分析。因此,為了最大限度提升數(shù)據(jù)應(yīng)用的有效性及可靠性,應(yīng)建立數(shù)據(jù)的采集規(guī)范和標準化存儲體系,在開展數(shù)據(jù)收集時重視收集數(shù)據(jù)的測繪基準信息,并在數(shù)據(jù)采集端對數(shù)據(jù)質(zhì)量進行檢驗和校核,從而為后續(xù)投影變換,數(shù)據(jù)銜接打下良好基礎(chǔ)。
測繪地理信息大數(shù)據(jù)平臺為海量測繪數(shù)據(jù)的存儲、共享以及分析利用提供了切實可行的解決方案。在大數(shù)據(jù)時代,得數(shù)據(jù)者得天下,數(shù)據(jù)的高速流動為測繪地理信息行業(yè)提供了廣闊的發(fā)展空間,同時也對傳統(tǒng)的管理思維方式、方法手段進行了強烈的沖擊。我們要緊緊跟隨時代的浪潮,主動轉(zhuǎn)變,才能使測繪地理信息數(shù)據(jù)真正融入到各行各業(yè)以及人民生活之中,為社會進步創(chuàng)造更多的價值。