韓 平,張建武,王佑武(61243部隊,新疆 烏魯木齊 830060)
?
淺析地理信息與位置大數(shù)據(jù)在地圖編制中的應用
韓平,張建武,王佑武
(61243部隊,新疆烏魯木齊830060)
摘要:簡述了大數(shù)據(jù)及其特點,分析了地圖編制中常見的問題困難,提出了利用地理信息與空間大數(shù)據(jù)開展地圖編制的方法和工作流程,進一步探討了大數(shù)據(jù)在全球地圖編制中的應用,為充分利用大數(shù)據(jù)思維高效開展全球地圖編制提供借鑒。
關鍵詞:大數(shù)據(jù);地圖;編制
大數(shù)據(jù)時代的到來對人們獲取數(shù)據(jù)、分析數(shù)據(jù)和利用數(shù)據(jù)的能力提出了新的挑戰(zhàn),為人們利用數(shù)據(jù)獲取最大的有用價值提供了前所未有的空間和潛力。大數(shù)據(jù)時代的來臨,也預示著測繪地理信息行業(yè)進入了一個全新的時代,給測繪地理信息時代的發(fā)展帶來了前所未有的機遇和挑戰(zhàn)。大數(shù)據(jù)及其技術的應用,也為快速高效解決地形圖編制中資料缺乏等困難提供了思路和方法。本論述主要就利用地理空間信息與位置大數(shù)據(jù)制作地圖的方法進行淺析。
2011年3月,美國奧巴馬政府在白宮網(wǎng)站發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》(Big Data Research and Development Initiative),旨在提升利用大量復雜數(shù)據(jù)集合獲取知識和洞見的能力,并將為此投入兩億美元以上資金。2011年10月,美國著名咨詢管理公司麥肯錫表示:“數(shù)據(jù),已經(jīng)滲透到當今的每一個行業(yè)和業(yè)務職能領域,稱為重要的生產(chǎn)要素。人們對于海量數(shù)據(jù)的挖掘和運用,預示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來”。大數(shù)據(jù)的概念在物理學、生物學、環(huán)境生態(tài)學以及軍事、金融通訊等行業(yè)的存在已有時日,但近期卻隨著互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展引起人們的重大關注[1]。
那么,到底什么是“大數(shù)據(jù)”呢?在百度百科、維基百科等搜索引擎網(wǎng)站中,大數(shù)據(jù)是指所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策的資訊。具有四個方面的特征:一是數(shù)據(jù)體量巨大,從TB級別躍升到PB級別;二是數(shù)據(jù)類型繁多,包括網(wǎng)絡日志、視頻、圖片、地理位置信息等各種類型數(shù)據(jù);三是價值密度低,商業(yè)價值高;四是處理速度快,遵循“1s定律”,即可從各種類型的數(shù)據(jù)中快速獲得高價值的信息,這與傳統(tǒng)的數(shù)據(jù)挖掘技術有著本質(zhì)的不同?!按髷?shù)據(jù)”的四大特征概括起來即4個“V”,即Volume(容量)、Variety(種類)、Value(價值)、Velocity(速度)[2]。
目前,經(jīng)過多年的努力發(fā)展,雖然測繪地理信息系統(tǒng)已積累了大數(shù)據(jù)量級別和多種類的地理信息數(shù)據(jù),包括全國矢量數(shù)據(jù)、影像數(shù)據(jù)及重力、三角、水準和GNSS大地測量成果等,但在地理信息覆蓋范圍上偏重于國內(nèi),尤其缺少全球地理信息數(shù)據(jù)。在獲取手段上,主要利用國產(chǎn)遙感衛(wèi)星測量系統(tǒng)無控制方式獲取,手段單一,且時空特征、屬性特征、精度特征都無法滿足要求,而空間信息與位置大數(shù)據(jù)能有效彌補這些不足。因此,充分利用大數(shù)據(jù)及其技術方法,依靠互聯(lián)網(wǎng)等載體,廣泛獲取所需區(qū)域空間信息與位置大數(shù)據(jù),能夠極大提高地形圖編制的質(zhì)量和效率。
3.1數(shù)據(jù)種類及特點
空間信息與位置大數(shù)據(jù)包括地理數(shù)據(jù)、軌跡數(shù)據(jù)、空間媒體數(shù)據(jù)等。其中,地理數(shù)據(jù)可以分為地圖數(shù)據(jù)、遙感數(shù)據(jù)、大地基準數(shù)據(jù),其特點是體量大、較規(guī)則化、變化緩慢。遙感數(shù)據(jù)包括光學影像數(shù)據(jù)、雷達激光掃描數(shù)據(jù)等,其特點是數(shù)據(jù)量大,種類多,數(shù)據(jù)增長規(guī)律不同,數(shù)據(jù)更新頻度不同,安全性要求高。大地基準數(shù)據(jù)包括時間基準數(shù)據(jù)、重力基準數(shù)據(jù)等。軌跡數(shù)據(jù)是通過GNSS、RFID等測量手段以及網(wǎng)絡簽到等方法獲得的用戶活動數(shù)據(jù),包括個人軌跡數(shù)據(jù)、群體的軌跡數(shù)據(jù)、交通軌跡數(shù)據(jù)、物流數(shù)據(jù)等。特點是數(shù)據(jù)體量大、信息碎片化、準確性低,可以用文本模式描述,有半結(jié)構(gòu)化的軌跡數(shù)據(jù),附帶其他的用戶信息和社會語義??臻g媒體數(shù)據(jù),包含空間位置與時間因標記的數(shù)字化文字圖像圖形、聲音、視頻影響和動畫等媒體數(shù)據(jù),主要來源于移動社交網(wǎng)絡、微博、微信等新興互聯(lián)網(wǎng)應用。特點是數(shù)據(jù)來源混雜、非結(jié)構(gòu)化為主,數(shù)據(jù)異構(gòu)性大,實時性非常強[3]。
3.2地理信息類大數(shù)據(jù)應用的常見問題
“地理信息”是指自然地理要素或地表人工設施的形狀、大小、空間位置及其屬性信息的總稱,因具有空間位置特征,通常又被稱為“地理空間信息”或“空間信息”[4]。目前,全球地圖編制通常包括兩類:一是全球地形圖、地理圖的編制與更新。包括重點地區(qū)大比例尺地形圖、系列比例尺地形圖、全球或局部地區(qū)軍事地理圖等。重點表示空間基礎地理信息,反映區(qū)域自然環(huán)境地形特征和地物信息。二是全球?qū)n}地圖(集)類編制。突出反映一種或多種專題要素空間分布及其規(guī)律的地圖,形式多樣,需要大量專題信息支撐。
過去,相比國內(nèi)地圖編制,由于缺少穩(wěn)定可靠的資料來源,缺乏編制規(guī)范與標準以及相關地圖產(chǎn)品作參考,國外地區(qū)地圖的編制要困難許多。隨著互聯(lián)網(wǎng)技術發(fā)展,大數(shù)據(jù)和云計算的全面應用,與空間地理位置相關的大數(shù)據(jù)給國外地圖編制出現(xiàn)了新的轉(zhuǎn)機。但目前仍存在許多瓶頸和待解決的問題。主要為:一是空間地理大數(shù)據(jù)的定位與評價,面對海量網(wǎng)絡資源,如何快速準確定位到所需專業(yè)信息資料,并針對特定需求進行數(shù)據(jù)分析判斷,得出評價結(jié)果,從而確定大數(shù)據(jù)選擇方案,是首要解決的問題;二是空間大數(shù)據(jù)的挖掘與處理問題,除部分可以直接應用的地理信息產(chǎn)品外,大部分空間大數(shù)據(jù)中包含有非專業(yè)信息和干擾信息,需要進行數(shù)據(jù)挖掘,提取和轉(zhuǎn)化為空間可視化和專題地理信息。同時,針對多源異構(gòu)地理數(shù)據(jù)的處理工作也是重點之一;三是缺乏國外資料應用規(guī)范與標準。由于國外資料到現(xiàn)行標準化規(guī)范化的地圖產(chǎn)品,還需要相應的應用規(guī)范與標準,包括空間基準統(tǒng)一、地理編碼體系轉(zhuǎn)化、要素分類分級的重構(gòu)等。
3.3地理空間大數(shù)據(jù)的應用方法與流程
在現(xiàn)有大數(shù)據(jù)背景下編制全球地圖,在獲取多源異構(gòu)地理空間數(shù)據(jù)基礎上,參照國家基本比例尺地圖修測規(guī)范[5]、專題地圖信息分類與編碼[6]等國家現(xiàn)行地理信息產(chǎn)品生產(chǎn)標準與規(guī)范,需要用到多種方法與技術手段。根據(jù)其數(shù)據(jù)不同分類,通常應用方法包括以下三類。
3.3.1全球地圖通用產(chǎn)品和基礎地理信息的應用
目前,通過互聯(lián)網(wǎng)和一些公開渠道能夠獲取到一些全球通用地圖產(chǎn)品,如國家基礎地理信息中生產(chǎn)的全球基礎地理底圖數(shù)據(jù)庫、美國Delorme公司生產(chǎn)的全球DAE數(shù)據(jù)、全球VMAP數(shù)據(jù)、美制航空圖、蘇制小比例尺地形圖等。這些通用地圖產(chǎn)品,具有較高精度和可靠性,但一般現(xiàn)勢性較差,可作為地圖編制的基礎數(shù)據(jù)和參考底圖,經(jīng)數(shù)據(jù)基準轉(zhuǎn)換后直接使用。
另外,基礎地理信息產(chǎn)品較為豐富,如全球SRTM和ASTER DEM數(shù)據(jù)、Google影像和線劃圖數(shù)據(jù)、我國資源、高分和天繪衛(wèi)星影像系列產(chǎn)品等。這些數(shù)據(jù)全球覆蓋面廣、更新及時、現(xiàn)勢性強、應用方便。輔助以影像定位糾正、影像判繪等技術,能夠廣泛應用到全球地圖的地貌要素生成、地理定位和部分屬性信息的編制與更新工作中。而且隨著對地觀測領域內(nèi)多種傳感器的發(fā)展,海量多源遙感數(shù)據(jù)獲取能力的提高,專業(yè)化的數(shù)據(jù)獲取與多源遙感數(shù)據(jù)的綜合應用呈現(xiàn)出精細化分工和協(xié)同式綜合處理需求并存的發(fā)展模式[7]。
3.3.2各要素層或?qū)n}類信息的應用
此類信息最為復雜,種類繁多,良莠不齊。除分開出版的專題地圖產(chǎn)品,如各國或地區(qū)交通圖、政區(qū)圖、旅游圖等,以及部分專業(yè)信息,如行政區(qū)劃、航空航海、地磁信息外。其余大部分信息需要通過通用或?qū)I(yè)資源網(wǎng)站獲取,如維基百科等。要滿足現(xiàn)行標準地圖產(chǎn)品編制需要,需進行資料的深入分析與改化,主要解決幾方面問題:一是數(shù)據(jù)可靠性分析與比較,可通過建立和分析其各種資料的元數(shù)據(jù)信息,使其數(shù)據(jù)來源、空間基準、現(xiàn)勢性、詳細程度等基本信息符合特定地圖編制需要。通過相同類信息的分析比較,選擇最優(yōu)資源或相互補充應用;二是解決資料尺度問題。包括時間尺度和空間尺度。不同類型的地圖對資料尺度都有相應的要求。資料與成圖尺度相差過大,會給編制過程增加制圖綜合困難;三是各類地理要素信息的處理與改化。包括數(shù)據(jù)基準和格式轉(zhuǎn)換,以及屬性信息編碼和要素分類分級等的改化等。
3.3.3地名類信息的應用
地名類信息作為空間地理信息的重要組成部分,在地圖編制中顯得尤為重要。首先因為全球使用語言不同,絕大部分國外地名信息需要翻譯后才能使用。同時,由于人文類地名信息更新變化較大,面對多種來源的地名類信息,如何在區(qū)分正誤基礎上確保地名的現(xiàn)勢性,是制圖人員面臨一個難題。目前采用的方法,除采用專業(yè)人員翻譯和相應翻譯軟件和標準規(guī)則,使用官方權(quán)威資料如全球地名庫外,傳統(tǒng)的同名資料的相互比較和印證方法還必不可少。圍繞大數(shù)據(jù)信息的應用,地圖編制基本流程如圖1所示。
圖1 編制流程
大數(shù)據(jù)及其獲取方法的研究應用能夠有效解決全球地圖編制中的重難點問題,本論述只從不同類別地理信息的獲取及應用方面做了較為粗淺的論述,為適應地理空間大數(shù)據(jù)發(fā)展趨勢和全球地圖編制需求,還應對大數(shù)據(jù)在全球地圖編制中的應用做進一步探討。一是應建立大數(shù)據(jù)地理信息發(fā)布機制。針對海量多源異構(gòu)數(shù)據(jù),凡是與地理位置相關的大數(shù)據(jù)來源與基本信息,均應建立統(tǒng)一檢索目錄,形成更新和信息發(fā)布機制,達到信息共享目的;二是建立地理信息大數(shù)據(jù)的分析評價模型和應用改化模型。應整合現(xiàn)有數(shù)據(jù)應用方法,建立統(tǒng)一的分析評價模型和數(shù)據(jù)應用改化模型,提高大數(shù)據(jù)的標準化和規(guī)范化應用;三是根據(jù)大數(shù)據(jù)來源和時間分辨率的復雜性,應擴充現(xiàn)有地圖要素屬性結(jié)構(gòu),記錄資料來源、可靠性分析結(jié)果以及時間信息等;四是需加強空間大數(shù)據(jù)的挖掘,從數(shù)據(jù)中提取信息,從信息中挖掘知識,在知識中萃取數(shù)據(jù)智能[8],在提高應用質(zhì)量的同時,強化了應用效率。
參考文獻:
[1]沈清華.大數(shù)據(jù)時代背景下的測量數(shù)據(jù)獲取手段[EB/ OL].http://www.pythontip.com,2014-03-04.
[2]熊偉.迎接測繪地理信息“大數(shù)據(jù)”時代[EB/OL].http:// www.fazhan.sbsm.gov.cn,2013-05-04.
[3]劉經(jīng)南.大數(shù)據(jù)時代的泛在測繪與位置服務[EB/OL]. http://www.news.ccidnet.com,2013-09-25.
[4]周順平,徐楓.大數(shù)據(jù)環(huán)境下地理信息產(chǎn)業(yè)發(fā)展的幾點思考[J].理論研究,2014,21(1):45-50.
[5]GBT 13989-2008國家基本比例尺地圖修測規(guī)范[S].北京:中國標準出版社,2008.
[6]GBT18317-2009專題地圖信息分類與編碼[S].北京:中國標準出版社,2009.
[7]宋維靜,劉鵬,王力哲.遙感大數(shù)據(jù)的職能處理:現(xiàn)狀與挑戰(zhàn)[J].工程研究,2014,6(3):259-265.
[8]王樹良,丁剛毅,鐘鳴.大數(shù)據(jù)下的空間數(shù)據(jù)挖掘思考[J].中國電子科學研究院學報,2013,8(1):8-17.
中圖分類號:P283