程飛飛
【摘 要】隨著互聯(lián)網(wǎng)技術(shù)(包括移動(dòng)互聯(lián)網(wǎng))的持續(xù)發(fā)展和進(jìn)步,人們生活生產(chǎn)中所累積的數(shù)據(jù)越來越多,并且越來越發(fā)現(xiàn)數(shù)據(jù)的價(jià)值超乎尋常,越來越多的科技企業(yè)巨頭投入到大數(shù)據(jù)的研究中,越來越多的互聯(lián)網(wǎng)企業(yè)意識(shí)到擁有數(shù)據(jù)的意義。地理學(xué)領(lǐng)域,地理空間的各種觀測(cè)數(shù)據(jù)逐年累積,現(xiàn)已達(dá)到地學(xué)大數(shù)據(jù)級(jí)別,那么地學(xué)大數(shù)據(jù)相比以往的地理學(xué)研究有什么樣的變化和發(fā)展機(jī)遇,現(xiàn)階段又遇到了什么樣的瓶頸和技術(shù)難題,下面將就這些問題來論述。
【關(guān)鍵字】大數(shù)據(jù) 地理學(xué) 地學(xué)數(shù)據(jù)
【Abstract】With Internet technology (including mobile internet) development and progress, more and more data has been created, more and more people discover the extraordinary value of the data, more and more top Tec-company start to giant big data, more and more Internet business aware of the sense of the data. In Geography, various observation geospatial data accumulated from year to year, and now has reached the level of big-geodata, so what kind of new changes and new opportunities in big geodata era compared to the previous study of geography, the following issues will be discussed. at this stage what they encountered bottlenecks and technical problems.
【Keyword】Bigdata;Geography;Geodata
0 引言
伴隨著以微博、社交網(wǎng)絡(luò)、基于位置的服務(wù)(LBS)為代表的新型信息發(fā)布方式的不斷涌現(xiàn),以及云計(jì)算、物聯(lián)網(wǎng)等技術(shù)的興起,數(shù)據(jù)正以前所未有的速度在不斷地增長(zhǎng)和累積,大數(shù)據(jù)時(shí)代已經(jīng)來到.學(xué)術(shù)界、企業(yè)界甚至于政府機(jī)構(gòu)都已經(jīng)開始密切關(guān)注大數(shù)據(jù)問題,并對(duì)其產(chǎn)生濃厚的興趣.就學(xué)術(shù)界而言,《Nature》早在2008年就推出了Big Data專刊[1]。計(jì)算社區(qū)聯(lián)盟(Computing Community Consortium)在2008年發(fā)表了報(bào)告“Big Data Computing:Creating revolutionary breakthroughs in commerce,science,and society”[2],闡述了在數(shù)據(jù)驅(qū)動(dòng)的研究背景下,解決大數(shù)據(jù)問題所需的技術(shù)以及面臨的一些挑戰(zhàn)?!禨cience》在2011年2月推出??癉ealing with Data”[3]。美國一些知名的數(shù)據(jù)管理領(lǐng)域的專家學(xué)者則從專業(yè)的研究角度出發(fā),聯(lián)合發(fā)布了一份白皮書《Challenges and Opportunities with Big Data》[4]。全球知名的咨詢公司麥肯錫(Mckinsey)2011年6月份發(fā)布了一份關(guān)于大數(shù)據(jù)的詳盡報(bào)告“Big data:The next frontier for innovation,competition,and productivity”[[5],對(duì)大數(shù)據(jù)的影響、關(guān)鍵技術(shù)和應(yīng)用領(lǐng)域等都進(jìn)行了詳盡的分析。2012年1月份的達(dá)沃斯世界經(jīng)濟(jì)論壇上,大數(shù)據(jù)是主題之一,會(huì)議針對(duì)大數(shù)據(jù)發(fā)布了報(bào)告“Big data,big impact:New possibilities for intrenational development”[6],探討了新的數(shù)據(jù)產(chǎn)生方式下,如何更好地利用數(shù)據(jù)來產(chǎn)生良好的社會(huì)效益。3月份美國奧巴馬政府發(fā)布了“大數(shù)據(jù)研究和發(fā)展倡議”[7](Big data research and development initiative),投資2億以上美元,正式啟動(dòng)“大數(shù)據(jù)發(fā)展計(jì)劃”。計(jì)劃在科學(xué)研究、環(huán)境、生物醫(yī)學(xué)等領(lǐng)域利用大數(shù)據(jù)技術(shù)進(jìn)行突破。與此同時(shí),聯(lián)合國一個(gè)名為“Global Pulse”的倡議項(xiàng)目在今年5月發(fā)布報(bào)告“Big data for development:challenges&opportunities”[8],該報(bào)告主要闡述大數(shù)據(jù)時(shí)代各國特別是發(fā)展中國家在面臨數(shù)據(jù)洪流(data deluge)的情況下所遇到的機(jī)遇與挑戰(zhàn),同時(shí)還對(duì)大數(shù)據(jù)的應(yīng)用進(jìn)行了初步的解讀.《紐約時(shí)報(bào)》的文章“the age of big data”[9]則通過主流媒體的宣傳使普通民眾開始意識(shí)到大數(shù)據(jù)的存在,以及大數(shù)據(jù)對(duì)于人們?nèi)粘I畹挠绊憽?/p>
大數(shù)據(jù)作為一種新型戰(zhàn)略資源,提供了一個(gè)在虛擬信息世界中透過該資源了解和掌握客觀現(xiàn)實(shí)世界的前所未有的機(jī)會(huì)[10]。隨著社會(huì)與經(jīng)濟(jì)調(diào)查與統(tǒng)計(jì)、對(duì)地觀測(cè)技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)和地理信息系統(tǒng)的快速發(fā)展和普及,具有空間位置的自然環(huán)境與社會(huì)經(jīng)濟(jì)數(shù)據(jù)近幾十年快速增長(zhǎng),形成了海量的時(shí)空數(shù)據(jù)集[11]和時(shí)空大數(shù)據(jù)[12]。現(xiàn)在國際地理學(xué)的發(fā)展聚焦在:揭示復(fù)雜系統(tǒng)中的不平衡和動(dòng)態(tài),認(rèn)識(shí)全球化 (包括環(huán)境" 經(jīng)濟(jì)“人口”政府和文化等)的潮流及其影響,建立從地方到全球的空間連續(xù)系列研究[13]。地理學(xué)的重要性越來越凸顯,在國家的宏觀發(fā)展策略、城市規(guī)劃、軍事武裝等領(lǐng)域,地理學(xué)有著重要的作用,在這個(gè)大數(shù)據(jù)時(shí)代,如何正確認(rèn)識(shí)地學(xué)大數(shù)據(jù)的意義,如何抓住地學(xué)大數(shù)據(jù)所帶來的技術(shù)和應(yīng)用的發(fā)展新機(jī)遇,如何助推地學(xué)大數(shù)據(jù)的快速發(fā)展,如何思考地學(xué)大數(shù)據(jù)的未來是接下來要探討的問題。
1 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)的定義
大數(shù)據(jù)尚未有一個(gè)公認(rèn)的定義,不同的定義基本是從大數(shù)據(jù)的特征出發(fā),通過這些特征的闡述和歸納試圖給出其定義。在這些定義中,比較有代表性的是3V定義[14],即認(rèn)為大數(shù)據(jù)需滿足3個(gè)特點(diǎn):規(guī)模性(volume)、多樣性(variety)和高速性(velocity)。除此之外,還有提出4v定義的,即嘗試在3v的基礎(chǔ)上增加一個(gè)新的特性。關(guān)于第4個(gè)v的說法并不統(tǒng)一,國際數(shù)據(jù)公司(International Data corporation)認(rèn)為大數(shù)據(jù)還應(yīng)當(dāng)具有價(jià)值性(value)[15],大數(shù)據(jù)的價(jià)值往往呈現(xiàn)出稀疏性的特點(diǎn)。而IBM認(rèn)為大數(shù)據(jù)必然具有真實(shí)性(veracity)[16]。維基百科對(duì)大數(shù)據(jù)的定義[17]則簡(jiǎn)單明了:大數(shù)據(jù)是指利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時(shí)間超過可容忍時(shí)間的數(shù)據(jù)集。
1.2 大數(shù)據(jù)的來源
根據(jù)國際數(shù)據(jù)公司(IDC)的《數(shù)據(jù)宇宙》報(bào)告顯示:2008 年全球數(shù)據(jù)量為0.5ZB,2010 年為1.2ZB,人類正式進(jìn)入ZB 時(shí)代。更為驚人的是,2020 年以前全球數(shù)據(jù)量仍將保持每年40%多的高速增長(zhǎng),大約每?jī)赡昃头槐?,預(yù)計(jì)2015 年全球數(shù)據(jù)量將達(dá)到7.9ZB,2020 年將突破35ZB。同時(shí),根據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心的《中國互聯(lián)網(wǎng)市場(chǎng)洞見:互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)創(chuàng)新研究2012》報(bào)告顯示:截至2011 年年底,中國互聯(lián)網(wǎng)行業(yè)持有的數(shù)據(jù)總量已達(dá)到1.9EB,預(yù)計(jì)2015 年該規(guī)模將增長(zhǎng)到8.2EB 以上。
這些大數(shù)據(jù)都是從哪里產(chǎn)生?大致可以分為以下幾個(gè)方面:(1)大型專業(yè)研究機(jī)構(gòu)產(chǎn)生大量的數(shù)據(jù)外(CERN 的離子對(duì)撞機(jī)每秒運(yùn)行產(chǎn)生的數(shù)據(jù)高40TB);(2)觀察測(cè)量性的數(shù)據(jù)(如對(duì)地觀測(cè),遙感衛(wèi)星等等);(3)科學(xué)實(shí)驗(yàn)產(chǎn)生的數(shù)據(jù)(物理、化學(xué)或者生物實(shí)驗(yàn));(4)越來越多的機(jī)器配備了連續(xù)測(cè)量和報(bào)告運(yùn)行情況的裝置。幾年前,跟蹤遙測(cè)發(fā)動(dòng)機(jī)運(yùn)行僅限于價(jià)值數(shù)百萬美元的航天飛機(jī)。現(xiàn)在,汽車生產(chǎn)商在車輛中配置了監(jiān)視器,連續(xù)提供車輛機(jī)械系統(tǒng)整體運(yùn)行情況。這些機(jī)器傳感數(shù)據(jù)屬于大數(shù)據(jù)的范圍;(5)計(jì)算機(jī)產(chǎn)生的數(shù)據(jù)可能包含著關(guān)于因特網(wǎng)和其他使用者行動(dòng)和行為的有趣信息,從而提供了對(duì)他們的愿望和需求潛在的有用認(rèn)識(shí);(6)使用者自身產(chǎn)生的數(shù)據(jù)信息。人們通過電郵、短信、微博等產(chǎn)生的文本信息;(7)至今最大的數(shù)據(jù)是音頻、視頻和符號(hào)數(shù)據(jù)。這些數(shù)據(jù)結(jié)構(gòu)松散,數(shù)量巨大,很難從中挖掘有意義的結(jié)論和有用的信息。
1.3 大數(shù)據(jù)的應(yīng)用現(xiàn)狀
大數(shù)據(jù)目前最主要的應(yīng)用還是在企業(yè)中,當(dāng)然科學(xué)研究中的應(yīng)用也在不斷拓展,大數(shù)據(jù)讓企業(yè)找到許多不曾解決的問題答案,而在此之前企業(yè)甚至不知道問題是什么。這可能會(huì)產(chǎn)生引出新產(chǎn)品的想法,或者幫助確定改善運(yùn)營效率的方法。不過,也有一些已經(jīng)明確的大數(shù)據(jù)用例,無論是互聯(lián)網(wǎng)巨頭如谷歌、Facebook、LinkedIn還是國內(nèi)的淘寶、騰迅QQ、新浪微博既是大數(shù)據(jù)的產(chǎn)生者、應(yīng)用者,也是研究者?!按髷?shù)據(jù)的工程技術(shù)研究已經(jīng)走在了科學(xué)前面?!?- 李國杰院士
但是當(dāng)技術(shù)解決不了的問題越來越多時(shí),就需要科學(xué)家找出共性的問題。可是科學(xué)家并不了解每個(gè)領(lǐng)域的特點(diǎn)和問題,目前各個(gè)領(lǐng)域中“數(shù)據(jù)界”的共性還不太清楚。 在科學(xué)家如何與企業(yè)界相結(jié)合、共同解決大數(shù)據(jù)問題上,香港中文大學(xué)教授華云生提出,大數(shù)據(jù)的研究要結(jié)合實(shí)際用戶問題,把問題、數(shù)據(jù)、平臺(tái)集中起來解決。
大數(shù)據(jù)的研究對(duì)于科學(xué)家來說,具有“顛覆性”的意義,長(zhǎng)期以來,許多領(lǐng)域都是在用小數(shù)據(jù)做科學(xué)實(shí)驗(yàn),找出一個(gè)模型和規(guī)律?,F(xiàn)在越來越復(fù)雜,有一堆數(shù)據(jù)看上去沒有規(guī)律??茖W(xué)家要找到新的研究方法,這種模式和方法的改變需要探索。要研究大數(shù)據(jù)的問題在哪兒,在應(yīng)用中發(fā)現(xiàn)什么技術(shù)難題,這些有針對(duì)性的問題,不是憑空想出來的,是需要實(shí)踐總結(jié)出來的。所以如何把大數(shù)據(jù)和科學(xué)研究很好地結(jié)合起來也是當(dāng)今面臨的一個(gè)問題。
2 地理學(xué)的大數(shù)據(jù)
2.1 地理數(shù)據(jù)是大數(shù)據(jù)的重要組成
“地理信息”是指自然地理要素或者地表人工設(shè)施的形狀、大小、空間位置及其屬性信息的總稱,因具有空間位置特征, 通常又被稱為“地理空間信息” 或“ 空間信息”(下文統(tǒng)一使用空間信息代指地理信息)??臻g數(shù)據(jù)是空間對(duì)象具有了空間分布和地理位置的屬性,因而不難發(fā)現(xiàn),一切與位置相關(guān)的數(shù)據(jù)都具有空間特征。用于獲取空間數(shù)據(jù)的手段很多,數(shù)據(jù)來源也十分廣泛,如圖1所示。
2.2 地理數(shù)據(jù)的特征
從地理學(xué)定義可以看出,數(shù)據(jù)是地理學(xué)的血液。從通過圖件掃描、格式轉(zhuǎn)換、實(shí)地測(cè)繪等方法的數(shù)據(jù)獲取,到采用各種先進(jìn)數(shù)據(jù)庫技術(shù)對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)、管理,再到利用計(jì)算機(jī)圖形學(xué)、地圖學(xué)等綜合可視化技術(shù)對(duì)數(shù)據(jù)進(jìn)行展示,以及最終以數(shù)據(jù)為基礎(chǔ)的借助于計(jì)量地理學(xué)、拓?fù)鋵W(xué)、圖論等學(xué)科的決策分析等,這些過程都是以據(jù)為核心的。隨著地理學(xué)的發(fā)展,其數(shù)據(jù)呈現(xiàn)出數(shù)量大、種類多和結(jié)構(gòu)復(fù)雜的特征。
2.2.1 地學(xué)數(shù)據(jù)量大
地學(xué)數(shù)據(jù)量大具有兩層含義,第一層含義是指數(shù)據(jù)存儲(chǔ)量大,這主要是針對(duì)柵格數(shù)據(jù)及多媒體數(shù)據(jù)而言的。 “天地圖”在2011年正式上線的時(shí)候,集成了海量的基礎(chǔ)地理信息資源數(shù)據(jù),總數(shù)據(jù)量約有30TB,處理后的瓦片數(shù)近30億。資源三號(hào)測(cè)繪衛(wèi)星是中國第一顆民用高分辨率光學(xué)傳輸型測(cè)繪衛(wèi)星,截止到2013年6月底,在運(yùn)行的不到一年半的時(shí)間中,總共存檔衛(wèi)星影像37萬多景,數(shù)據(jù)量達(dá)到249TB。而地里信息空間數(shù)據(jù)產(chǎn)生的商業(yè)價(jià)值每年正以15.5%的速度增加,是地理信息軟件和服務(wù)的兩倍。地理學(xué)數(shù)據(jù)量大的第二層含義是指數(shù)據(jù)單位個(gè)數(shù)多。“天地圖”各類地名和POI(Point of Interest,興趣點(diǎn))有1100多萬條,2011年8月竣工的國家西部1∶50000地形圖空白區(qū)測(cè)圖工程和國家1∶50000基礎(chǔ)地理信息數(shù)據(jù)庫更新工程兩個(gè)國家級(jí)重大測(cè)繪工程,成果有20多萬航片和8000多景衛(wèi)星遙感影像,地名近600萬條,描繪了1.4億個(gè)地理要素。另外,其他專業(yè)領(lǐng)域比如土壤數(shù)據(jù)、氣象數(shù)據(jù)在全數(shù)據(jù)模式下數(shù)量也是非??捎^的。
2.2.2 地學(xué)數(shù)據(jù)種類多
地理學(xué)的數(shù)據(jù)種類多樣,從大的方面看,具有矢量數(shù)據(jù)、柵格數(shù)據(jù)、屬性數(shù)據(jù),以及與地理位置相關(guān)的音頻、視頻等多媒體數(shù)據(jù)等;而從小的角度看,主要是因?yàn)閿?shù)據(jù)來源廣泛和不同應(yīng)用的需求而體現(xiàn)為數(shù)據(jù)格式多樣,資源三號(hào)衛(wèi)星TLC(三線陣相機(jī))標(biāo)準(zhǔn)產(chǎn)品中的1A級(jí)產(chǎn)品(預(yù)處理級(jí)輻射校正影像產(chǎn)品)包括的文件格式就有tiff、rpb、xml、jpeg等四種格式的15個(gè)文件。GDAL/OGR是地理空間數(shù)據(jù)轉(zhuǎn)換的類庫,多用來讀取地理空間數(shù)據(jù),根據(jù)GDAL官方網(wǎng)站的資料顯示,GDAL/OGR支持的柵格數(shù)據(jù)多達(dá)132種,矢量數(shù)據(jù)有71種,這其中也包括了PostGIS、Spatialite、ArcSDE這樣的數(shù)據(jù)源。
2.2.3 地學(xué)數(shù)據(jù)結(jié)構(gòu)復(fù)雜
隨著科技的發(fā)展,人們獲取信息的方式越來越多,獲取的數(shù)據(jù)量也呈爆炸式增長(zhǎng),而這些信息中大概85%是非結(jié)構(gòu)化的。傳統(tǒng)的地理信息主要有空間數(shù)據(jù)和屬性數(shù)據(jù)兩類數(shù)據(jù),空間數(shù)據(jù)以二進(jìn)制文件的方式進(jìn)行存儲(chǔ),屬性數(shù)據(jù)以二維表的方式進(jìn)行存儲(chǔ),具有固定字段,另外還有以文本存儲(chǔ)的投影信息等。如今在地學(xué)中,非結(jié)構(gòu)化的數(shù)據(jù)越來越多,如Google Earth中用戶可以上傳基于地理位置的圖片,iOS的相冊(cè)提供了在地圖上顯示照片和視頻信息的功能,像是LBS(Location Based Service,基于位置的服務(wù))一類的應(yīng)用,更是需要在地理信息的基礎(chǔ)上,集成周邊不同類型POI的詳細(xì)信息、用戶實(shí)時(shí)發(fā)布的文本或多媒體信息等,這些信息絕大多數(shù)都是非結(jié)構(gòu)化的。在用于人口普查的地理信息系統(tǒng)中,基本的人口信息是結(jié)構(gòu)化的,但是如果詳盡一些的信息或是存儲(chǔ)個(gè)性化的信息,若加入個(gè)體從小到大的教育經(jīng)歷、特長(zhǎng)及獎(jiǎng)項(xiàng)等信息,數(shù)據(jù)就會(huì)變?yōu)榉墙Y(jié)構(gòu)化的,因?yàn)椴皇敲總€(gè)人都會(huì)有大學(xué)的教育經(jīng)歷,也不是每個(gè)人具有某種特長(zhǎng)并得過獎(jiǎng)項(xiàng),這在數(shù)據(jù)庫中表現(xiàn)為每個(gè)人需要有不同的數(shù)據(jù)項(xiàng)來記錄這些細(xì)化的信息。
3 大數(shù)據(jù)對(duì)地理學(xué)的影響
現(xiàn)如今,地理信息不再只是把符號(hào)和數(shù)字作為其代名詞,也不在僅僅局限于地理行業(yè)的需要。信息的使用者對(duì)地理信息的需求也不再局限于靜態(tài)的、定期更新的信息,而更加倚重于公眾參與更新的實(shí)時(shí)或準(zhǔn)實(shí)時(shí)信息。大數(shù)據(jù)中包含空間位置信息的數(shù)據(jù)量激增給地理信息的發(fā)展擴(kuò)大了“交際圈”。
物聯(lián)網(wǎng)技術(shù)背景下的傳感器數(shù)據(jù)、視頻監(jiān)控流媒體數(shù)據(jù)等,尚屬新型待收納和待管理的數(shù)據(jù),這些海量新資源將有力拓寬地理學(xué)發(fā)展的平臺(tái),地理研究者能管理好、使用好這些新數(shù)據(jù)、新資源。
現(xiàn)在,地理學(xué)服務(wù)的對(duì)象不再局限于政府部門或者對(duì)地理信息有特殊需求的企業(yè)和單位,而是面向所有對(duì)位置信息有需要甚至僅僅是有興趣的個(gè)人,這就使得服務(wù)端的需求呈現(xiàn)“大客戶化”,數(shù)量龐大、類型眾多的服務(wù)需求將嚴(yán)重挑戰(zhàn)傳統(tǒng)服務(wù)模式的承受度,使得服務(wù)商在服務(wù)資源的可伸縮性、服務(wù)效率的平衡性、服務(wù)類別的兼顧性上,都需要進(jìn)行改革和創(chuàng)新,使新的地理信息服務(wù)模式能更加快速、友好、科學(xué)。
最后還要提及的便是,大數(shù)據(jù)給我們提供了非常有意義的認(rèn)識(shí),即地理信息技術(shù)在行業(yè)應(yīng)用中所實(shí)現(xiàn)的信息共享,將能夠?yàn)楦嗟挠脩籼峁┯行医y(tǒng)一的數(shù)據(jù)展示手段。
4 地理信息對(duì)大數(shù)據(jù)技術(shù)的要求
4.1 數(shù)據(jù)的存儲(chǔ)
一位美國大學(xué)的學(xué)者在其2012年文章里說:“Among all the definitions offered for “big data,” my favorite is that it means data thats too big,too fast,or too hard for existing tools to process?!彼袁F(xiàn)在大數(shù)據(jù)的規(guī)模、涌現(xiàn)速度和處理難點(diǎn)超出目前常規(guī)技術(shù)能管理、處理和分析的數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)庫技術(shù)面對(duì)大數(shù)據(jù)已經(jīng)不敷使用。
地理空間的數(shù)據(jù)量正以爆發(fā)式速率不斷的增長(zhǎng)著,并且地理空間數(shù)據(jù)又多呈現(xiàn)出非結(jié)構(gòu)化的屬性,因此地理空間數(shù)據(jù)具有典型的大數(shù)據(jù)特征。于是對(duì)海量的空間數(shù)據(jù)存儲(chǔ)這一問題,一直都是地理學(xué)的重點(diǎn)研究方向之一。如何將地學(xué)中的大數(shù)據(jù)進(jìn)行共享,如何對(duì)大數(shù)據(jù)的文件進(jìn)行管理與保護(hù),如何解決大量的重復(fù)數(shù)據(jù)等問題,都將成為地理學(xué)在大數(shù)據(jù)時(shí)代下所面臨的新挑戰(zhàn)。
4.2 數(shù)據(jù)的處理和分析
全球數(shù)據(jù)量每?jī)赡攴环H绱硕嗟臄?shù)據(jù)只有轉(zhuǎn)化為信息才能有其價(jià)值,地學(xué)數(shù)據(jù)也只有被各個(gè)領(lǐng)域的地學(xué)研究者應(yīng)用到實(shí)際研究中才能有意義,對(duì)地理學(xué)研究來說,發(fā)現(xiàn)空間知識(shí)是利用空間數(shù)據(jù)挖掘方法從大數(shù)據(jù)中抽取事先未知、潛在有用、最終可解的規(guī)則的技術(shù),也是一個(gè)由空間數(shù)據(jù)到空間信息、再到空間知識(shí)的循序漸進(jìn)、逐漸升華的過程。通過處理龐大地學(xué)數(shù)據(jù)集,有效的獲取、描述、認(rèn)知現(xiàn)有地理空間。分析地學(xué)大數(shù)據(jù)進(jìn)行相關(guān)地學(xué)事件的預(yù)報(bào)預(yù)測(cè)。分析地學(xué)大數(shù)據(jù)對(duì)國家的重大決策進(jìn)行支持,調(diào)控現(xiàn)有地理空間上發(fā)生的事件,合理分配資源。如在“一帶兩路”上基于現(xiàn)有龐大地理數(shù)據(jù)給出合理的建議。
5 結(jié)語
信息技術(shù)時(shí)代背景下,大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算等技術(shù)的出現(xiàn),給地理信息帶來了前所未有的機(jī)遇,同時(shí)也帶來了巨大的挑戰(zhàn)。在此之前,我國的地理信息技術(shù)的發(fā)展道路一直是向國外學(xué)習(xí),但是現(xiàn)在我國和國外的同行站到了同一起跑線,怎么樣實(shí)現(xiàn)追趕并超越是我國地理信息方面的學(xué)者、企業(yè)、以及相關(guān)配套人員應(yīng)該著重研究的,現(xiàn)在我國的超級(jí)計(jì)算機(jī)技術(shù)已經(jīng)實(shí)現(xiàn)世界領(lǐng)先,利用這一技術(shù)來進(jìn)行大數(shù)據(jù)的處理和分析肯定更得心應(yīng)手,大數(shù)據(jù)就是一座持續(xù)循環(huán)的金礦,等待我們?nèi)ネ诰颉,F(xiàn)如今大數(shù)據(jù)在商業(yè)、搜索引擎、金融等領(lǐng)域已經(jīng)廣泛應(yīng)用并取得很好的效果,我們應(yīng)該把地理信息的大數(shù)據(jù)應(yīng)用到實(shí)際中,并讓它產(chǎn)生一定價(jià)值,這樣才能更好的使其得到發(fā)展。
參考文獻(xiàn):
[1] Nature.Big Data[EBOL].[2012-10-02].
[2] Bryant RE,Katz RH,Lazowska ED.BigData computing:Creating revolutionary breakthoughs in commerce,science,and society[R].[2012-10-02].
[3] Science.Special online collection:Dealing with data [EBOL].[2012-10-02].
[4] Agrawal D,Bernstein P,Bertino E,etal.Challenges and opportunities with big data-A community white paper developed by leading researchers across the United States[ROL].[2012-10-02].
[5] Manyika J,Chui M,Brown B,et al.Big data:The next frontier for innovation,competition,and productivity[Rol].[2012-10-02].
[6] World Economic Forum.Big data,big impect:New possibilities for international development[ROL].[2012-10-02].
[7]王勁峰,葛詠,李連發(fā)等.地理學(xué)時(shí)空數(shù)據(jù)分析.201409,69(9)10.11821/dlxb201409007
[8]蔡運(yùn)龍,陸大道,周一星等.地理科學(xué)的中國進(jìn)展與國際趨勢(shì).地理學(xué)報(bào),200411,59(6)803-810.
[9]《中國互聯(lián)網(wǎng)市場(chǎng)洞見:互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)創(chuàng)新研究2012》.
[10]李國杰,程學(xué)旗. 大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考,中國科學(xué)院院刊,10.3969/j.issn.1000-3045.2012.06.001.
[11]王明才,姚承寬.對(duì)發(fā)展我國地理信息產(chǎn)業(yè)的若干建議[J].現(xiàn)代測(cè)繪,2010,33(2):62-64.
[12]周順平,徐 楓.大數(shù)據(jù)環(huán)境下地理信息產(chǎn)業(yè)發(fā)展的幾點(diǎn)思考.地理信息世界1672-1586(2014)01-0045-06.
[13]尤文辰,徐躍通,高尚.淺析GIS大數(shù)據(jù).電腦知識(shí)與技術(shù).ISSN 1009-3044.
[14]張德政,張萍萍.非結(jié)構(gòu)化信息管理[J].微計(jì)算機(jī)信息,2006,22(3-3):218-219,239.
[15]袁磊,趙俊三,李紅波.物聯(lián)網(wǎng)空間倉庫框架體系及關(guān)鍵技術(shù)分析[J].地理信息界,2013,11(1):58-62.
[16] 邊馥苓.用數(shù)字的眼光看世界[M].武漢:武漢大學(xué)出版社,2011.
[17]王勁峰,李連發(fā), 葛 詠等. 地理信息空間分析的理論體系探討.0375-5444 ( 2000) 01-0092-12.