黃惠筱
(百色市國土資源信息測繪中心 廣西百色市 533000)
大數(shù)據(jù)技術(shù)在國土建設(shè)管理與服務(wù)中的應(yīng)用
黃惠筱
(百色市國土資源信息測繪中心 廣西百色市 533000)
近年來,隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、計(jì)算機(jī)與社交網(wǎng)絡(luò)等先進(jìn)信息技術(shù)的廣泛應(yīng)用與推廣,人類活動(dòng)產(chǎn)生的數(shù)據(jù)日益增加,數(shù)據(jù)種類越來越多,數(shù)據(jù)在寬帶網(wǎng)絡(luò)中高速流動(dòng),使得數(shù)據(jù)待開發(fā)價(jià)值逐漸增大,推動(dòng)大數(shù)據(jù)時(shí)代的發(fā)展。當(dāng)前,大數(shù)據(jù)理念也深入人心,大數(shù)據(jù)技術(shù)種類逐漸增多,但大數(shù)據(jù)的應(yīng)用還處于初期階段。在國土資源信息化建設(shè)中,應(yīng)采用大數(shù)據(jù)技術(shù)發(fā)展的優(yōu)勢,挖掘國土資源數(shù)據(jù)的潛在價(jià)值,為公眾提供更好的服務(wù),為國土決策與國土宏觀調(diào)控提供參考。
大數(shù)據(jù)技術(shù);國土建設(shè);管理;服務(wù);應(yīng)用
近年來,隨著信息采集技術(shù)的迅速發(fā)展,國土資源基礎(chǔ)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、管理數(shù)據(jù)與監(jiān)測數(shù)據(jù)也在不斷增長,各類遙感影像數(shù)據(jù)、國土資源調(diào)查數(shù)據(jù)、基本農(nóng)田與重點(diǎn)礦山監(jiān)測數(shù)據(jù)、地質(zhì)災(zāi)害預(yù)警預(yù)報(bào)數(shù)據(jù)等,都具有大數(shù)據(jù)的特征。所以,在日后較長一段時(shí)間內(nèi),國土資源行業(yè)信息化改革必定在大數(shù)據(jù)技術(shù)基礎(chǔ)上進(jìn)行。在國土資源信息化建設(shè)中引入大數(shù)據(jù)技術(shù),將產(chǎn)生巨大的經(jīng)濟(jì)效益和社會(huì)效益。
當(dāng)前,大眾已經(jīng)真正意識(shí)到大數(shù)據(jù)潛在的、巨大的價(jià)值,但通過數(shù)據(jù)的開放、整合與分析,可不斷發(fā)現(xiàn)新的知識(shí),并且還可迅速玩挖掘大數(shù)據(jù)的潛在價(jià)值,是現(xiàn)代社會(huì)中大數(shù)據(jù)應(yīng)用情況下亟待解決的問題。此外,通過大數(shù)據(jù)的合理應(yīng)用,可產(chǎn)生較大的數(shù)據(jù)分析價(jià)值,此類價(jià)值會(huì)隨著信息公開與共享程度不斷加大,但大數(shù)據(jù)信息安全也需要投入高度的關(guān)注,通過建立相關(guān)信息的采集、管控、敏感數(shù)據(jù)管理與數(shù)據(jù)交換等范圍內(nèi)的法規(guī)制度,可有效維護(hù)大數(shù)據(jù)產(chǎn)業(yè)的健康發(fā)展。
大數(shù)據(jù)能夠帶來巨大的利益,大數(shù)據(jù)的規(guī)模性、高速型與多樣性等本質(zhì)直接決定了其處理過程的復(fù)雜性,這使得大數(shù)據(jù)的處理工作成為了亟待解決的重要問題。一般情況下,大數(shù)據(jù)處理流程主要分為數(shù)據(jù)獲取階段、數(shù)據(jù)集成階段、數(shù)據(jù)分析解釋階段。對(duì)于大數(shù)據(jù)處理流程,具體如圖1所示。
2.1 數(shù)據(jù)獲取階段
數(shù)據(jù)獲取階段主要負(fù)責(zé)外界數(shù)據(jù)源的接收與記錄操作。其中,對(duì)于大數(shù)據(jù)的接收,主要包括傳感器獲取、網(wǎng)頁點(diǎn)擊獲取、移動(dòng)設(shè)備應(yīng)用服務(wù)獲取與射頻識(shí)別技術(shù)(RFID)獲取等方式。對(duì)于大數(shù)據(jù)的記錄,主要是對(duì)元數(shù)據(jù)的選擇,以此來為所需要的數(shù)據(jù)結(jié)構(gòu)的構(gòu)建提供便利。
2.2 數(shù)據(jù)集成階段
圖1 大數(shù)據(jù)處理流程
2.2.1 抽取
通過大數(shù)據(jù)定義可知,由大數(shù)據(jù)獲得的數(shù)據(jù)有可能具備多種結(jié)構(gòu)與類型,數(shù)據(jù)抽取能夠?yàn)閺?fù)雜數(shù)據(jù)轉(zhuǎn)化為單一或是便于處理的結(jié)構(gòu)類型提供便利,以實(shí)現(xiàn)快速分析處理目的。例如一些交通事故的發(fā)生,雖然者的口述表達(dá)與監(jiān)控?cái)z像頭的拍攝顯示都能夠在一定程度上直接反映出交通事故的實(shí)際經(jīng)過,但由于數(shù)據(jù)格式的差異,對(duì)此類問題的大規(guī)模統(tǒng)計(jì)分析具有一定的難度,將這些數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一標(biāo)準(zhǔn)的表示格式,能夠?yàn)楹笃诜治龉ぷ鞯捻樌M(jìn)行提供便利。
2.2.2 清洗
大數(shù)據(jù)并不是全部具備價(jià)值,部分?jǐn)?shù)據(jù)有可能不是人們所需要的內(nèi)容,或是部分?jǐn)?shù)據(jù)屬于完全錯(cuò)誤的項(xiàng)目,這就需要對(duì)其中的有效數(shù)據(jù)進(jìn)行提取。通過過濾器的設(shè)計(jì)與應(yīng)用,并采用某些規(guī)則,可將無利用價(jià)值的甚至是錯(cuò)誤的數(shù)據(jù)全部過濾出去,避免影響到后期分析工作。例如對(duì)交通事故的描述,部門目擊人員或是當(dāng)事者的一些主觀或客觀原因提供了一些模糊的或是虛假的信息,對(duì)這些信息的過濾操作尤其重要。
2.2.3 儲(chǔ)存
有效存儲(chǔ)經(jīng)過處理處理之后的數(shù)據(jù)具有十分重要的意義,如果僅將這些記錄隨意放入某個(gè)數(shù)據(jù)庫中,必將導(dǎo)致數(shù)據(jù)訪問問題,極有可能導(dǎo)致數(shù)據(jù)無法重復(fù)使用,這就需要設(shè)計(jì)一個(gè)適宜的數(shù)據(jù)庫,可有效解決數(shù)據(jù)難以復(fù)用的問題。一般情況下,數(shù)據(jù)庫的選擇具有多樣化特征,所以,針對(duì)特定的數(shù)據(jù)設(shè)計(jì)特殊的數(shù)據(jù)庫,可提升數(shù)據(jù)利用高效性與適用性。
2.3 數(shù)據(jù)分析和解釋階段
當(dāng)用戶提出查詢請(qǐng)求之后,應(yīng)對(duì)其進(jìn)行及時(shí)的分析,并且還要做好建模操作,然后將結(jié)果以用戶能夠接受的方式返回至用戶。此階段用戶查詢具有多樣性,不同的查詢輸入應(yīng)獲得對(duì)應(yīng)的結(jié)果,即便面對(duì)用戶的錯(cuò)誤查詢,也需要給出相應(yīng)的錯(cuò)誤友好處理。一般情況下,分析與建模過程也具有多樣性特征,統(tǒng)計(jì)學(xué)、數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)等各種方式的有效結(jié)合能夠產(chǎn)生各種智能推薦系統(tǒng),可較好的滿足用戶查詢請(qǐng)求。
國土資源信息是一種主要的國情信息,形式多樣化,內(nèi)容較為豐富,包含河流、山川等自然地理信息與礦產(chǎn)資源與地質(zhì)災(zāi)害等地質(zhì)信息,以及地表風(fēng)貌、良田土地信息等海洋信息等。
國土資源信息系統(tǒng)是反映國土資源信息的直接介質(zhì),數(shù)據(jù)規(guī)模較為龐大,種類相對(duì)繁瑣,格式也比較復(fù)雜。國體資源信息是地球科學(xué)研究順利開展的重要基礎(chǔ),可促進(jìn)重要物資資源與能源資源的持續(xù)發(fā)展,是可持續(xù)發(fā)展的生產(chǎn)力要素與寶貴的財(cái)富。在我國多年國土資源調(diào)查、監(jiān)測、評(píng)價(jià)與研究過程中,國土資源部門積累了大量的資料,這些歷史積累資料與正在形成的國體資源科學(xué)數(shù)據(jù),主要包含地球表面及其內(nèi)部信息,獲取難度相對(duì)較大,獲取成本也較高,但具有巨大的科學(xué)利用價(jià)值,有利于地球科學(xué)資源環(huán)境科學(xué)與有關(guān)工程技術(shù)科學(xué)的發(fā)展與更新,并且還可為國家資源的安全提供堅(jiān)實(shí)的保障,可推動(dòng)資源產(chǎn)業(yè)的持續(xù)發(fā)展。
在國家空間數(shù)據(jù)基礎(chǔ)建設(shè)過程中,國土資源數(shù)據(jù)庫具有關(guān)鍵性作用,當(dāng)前,我國部分省、市、縣各級(jí)分別構(gòu)建了土地利用現(xiàn)狀、土地利用規(guī)劃、基本農(nóng)田、礦產(chǎn)資源規(guī)劃等數(shù)據(jù)庫。近年來,隨著視頻、傳感器、智能設(shè)備等技術(shù)的不斷發(fā)展,形成了大量的視頻、音頻、文本、日志文件、物聯(lián)網(wǎng)以及傳感器等數(shù)據(jù),大大增加了國土資源數(shù)據(jù)量。各類型國土資源數(shù)據(jù)具有巨大的潛在價(jià)值,需要對(duì)這些數(shù)據(jù)進(jìn)行有組織的采集、存儲(chǔ)與管理,這就要實(shí)現(xiàn)不同數(shù)據(jù)庫的整合,并且還需構(gòu)建統(tǒng)一的數(shù)據(jù)模型,以實(shí)現(xiàn)主數(shù)據(jù)管理,然后還應(yīng)采用提取、轉(zhuǎn)換與加載等技術(shù),實(shí)現(xiàn)內(nèi)部結(jié)構(gòu)化數(shù)據(jù)的集成目的。
對(duì)于非結(jié)構(gòu)化數(shù)據(jù),應(yīng)不斷引入新的大數(shù)據(jù)平臺(tái)與技術(shù),以不斷強(qiáng)化處理與集聚。對(duì)于集成數(shù)據(jù),大多為大容量的、多種類的大數(shù)據(jù),所以需采用各種方式與設(shè)備,對(duì)聚集的大數(shù)據(jù)進(jìn)行客觀的、科學(xué)的處理與分析,以形成能夠直接為科學(xué)研究與其他工藝活動(dòng)運(yùn)用的數(shù)據(jù),這是提取信息、發(fā)現(xiàn)知識(shí)與預(yù)測未來的重要基礎(chǔ)。通常情況下,隨著數(shù)據(jù)被重復(fù)利用次數(shù)的不斷增多,其所能夠發(fā)揮出的價(jià)值也會(huì)越來越大,例如在基本農(nóng)田數(shù)據(jù)基礎(chǔ)上,通過對(duì)土壤、灌溉等變化因素進(jìn)行有效的結(jié)合,可采用大數(shù)據(jù)分析方法構(gòu)建基本農(nóng)田質(zhì)量影響評(píng)價(jià)模型,進(jìn)而實(shí)現(xiàn)基本農(nóng)田的動(dòng)態(tài)保護(hù)、監(jiān)測與評(píng)估目的。通過合理分析農(nóng)用地分等定級(jí)數(shù)據(jù),還可為土地定級(jí)估價(jià)、農(nóng)用地的適宜性評(píng)價(jià)、城鎮(zhèn)發(fā)展規(guī)劃提供一定的指導(dǎo)。在地質(zhì)災(zāi)害評(píng)估中,大面積的災(zāi)害區(qū)分類、災(zāi)害等級(jí)識(shí)別和災(zāi)情預(yù)報(bào)等是地質(zhì)災(zāi)害調(diào)查評(píng)估的難點(diǎn),分析大數(shù)據(jù)以及綜合地形、氣象、遙感信息等作為地質(zhì)災(zāi)害預(yù)測、評(píng)估的工具,具有巨大的優(yōu)勢。
當(dāng)前,某國土資源廳將積極推動(dòng)國土資源遙感監(jiān)測“一張圖”工程建設(shè),不斷完善國土資源電子政務(wù)平臺(tái)、綜監(jiān)管平臺(tái)、數(shù)據(jù)共享服務(wù)平臺(tái),認(rèn)真研究構(gòu)建新一代的國土資源數(shù)據(jù)中心,努力為全省國土資源開發(fā)利用工作提供強(qiáng)有力的信息技術(shù)支撐,進(jìn)一步提升國土資源監(jiān)管能力,提升服務(wù)全省經(jīng)濟(jì)和社會(huì)可持續(xù)發(fā)展的能力,并針對(duì)大數(shù)據(jù)來源和承載方式多樣性的特點(diǎn),在有效結(jié)合云計(jì)算、物聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)技術(shù)的基礎(chǔ)上,高度關(guān)注大數(shù)據(jù)與安全技術(shù)的發(fā)展融合,重視國土資源大數(shù)據(jù)的存儲(chǔ)管理和挖掘分析。
(1)增強(qiáng)大數(shù)據(jù)技術(shù)保障能力,并不斷加強(qiáng)安全測評(píng)、電子認(rèn)證、應(yīng)急防范等信息安全基礎(chǔ)性工作,大力推廣國產(chǎn)密碼算法應(yīng)用。加快大數(shù)據(jù)安全軟硬件技術(shù)產(chǎn)品研發(fā)和標(biāo)準(zhǔn)的制定,構(gòu)建大數(shù)據(jù)安全評(píng)估體系,提升大數(shù)據(jù)平臺(tái)信息安全監(jiān)測、預(yù)警和應(yīng)對(duì)能力。同時(shí),還應(yīng)不斷加強(qiáng)測試工具研發(fā)力度,大力開展大數(shù)據(jù)平臺(tái)可靠性及安全性評(píng)測服務(wù),為大數(shù)據(jù)安全可控和有序發(fā)展提供有效的引導(dǎo)。
(2)建設(shè)信息安全保障體系與大數(shù)據(jù)環(huán)境下的信息安全認(rèn)證體系,做好信息安全頂層設(shè)計(jì)工作,有效保障數(shù)據(jù)采集、傳輸、處理等各個(gè)環(huán)節(jié)的安全可靠。圍繞信息系統(tǒng)安全、基礎(chǔ)設(shè)施安全、云平臺(tái)安全、網(wǎng)絡(luò)通信安全、數(shù)據(jù)安全、身份認(rèn)證與管理等,積極開展全面系統(tǒng)的信息安全保障試點(diǎn)工作,大力探索并構(gòu)建適宜的信息安全保障體系。
(3)制定相關(guān)標(biāo)準(zhǔn)規(guī)范以及大數(shù)據(jù)采集、管理、共享、交易等標(biāo)準(zhǔn)規(guī)范,明確收集數(shù)據(jù)的范圍與格式、數(shù)據(jù)管理的權(quán)限與程序、開放數(shù)據(jù)內(nèi)容與格式、訪問方式等。制定、出臺(tái)數(shù)據(jù)資源開放指導(dǎo)辦法和數(shù)據(jù)資源安全開放標(biāo)準(zhǔn)規(guī)范,在嚴(yán)格遵循“開放優(yōu)先、安全例外、分類分級(jí)”原則的基礎(chǔ)上,對(duì)大數(shù)據(jù)中心的數(shù)據(jù)資源進(jìn)行合理的梳理,并對(duì)開放風(fēng)險(xiǎn)進(jìn)行相應(yīng)的評(píng)估,制定數(shù)據(jù)開放目錄,但需要及時(shí)更新。
(4)加強(qiáng)大數(shù)據(jù)資源安全管理,并且還需面向大數(shù)據(jù)平臺(tái)建設(shè)與應(yīng)用服務(wù)需求,圍繞大數(shù)據(jù)資源的分級(jí)、共享、開放、交易等,加強(qiáng)標(biāo)準(zhǔn)規(guī)范的制定和實(shí)施。
綜上所述,數(shù)據(jù)正逐漸成為組織財(cái)富與創(chuàng)新的關(guān)鍵,大數(shù)據(jù)正在促進(jìn)智能社會(huì)的發(fā)展。大數(shù)據(jù)是一門新興學(xué)科,必將在更多的領(lǐng)域中獲得更加廣泛的應(yīng)用。在國土信息化建設(shè)應(yīng)用過程中,應(yīng)有效結(jié)合國土相關(guān)知識(shí)與大數(shù)據(jù)技術(shù),并且還要科學(xué)的分析利用國土資源大數(shù)據(jù),可為國土決策、國家基礎(chǔ)科學(xué)研究與前沿研究提供一定的技術(shù)支撐,還可為相關(guān)行業(yè)的發(fā)展提供基礎(chǔ)數(shù)據(jù)服務(wù),并且還能夠?yàn)閲覅^(qū)域的發(fā)展規(guī)劃、宏觀調(diào)控與決策提供參考。
[1]虛擬化與云計(jì)算小組.云計(jì)算實(shí)踐之道[M].北京:電子工業(yè)出版社,2011.
[2]廣小明,胡 杰.虛擬化技術(shù)原理與實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2012.
[3]江蘇省國土資源廳.江蘇省國土資源信息化“十二五”規(guī)劃[R].南京:江蘇省國土資源廳,2012:5~8.
[4]涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2013.
F299.2
A
1004-7344(2016)18-0182-02
2016-5-19
黃惠筱(1988-),女,助理工程師,大學(xué)本科學(xué)士學(xué)位,從事國土資源相關(guān)數(shù)據(jù)處理、計(jì)算機(jī)網(wǎng)絡(luò)機(jī)房維護(hù)、土地規(guī)劃、專題圖制作工作。