劉春娥
摘要:在當(dāng)前大數(shù)據(jù)時(shí)代的背景下,地質(zhì)數(shù)據(jù)海量數(shù)據(jù)的發(fā)現(xiàn)和提取難度加大,地質(zhì)數(shù)據(jù)信息的開發(fā)將面臨信息開發(fā)和知識(shí)服務(wù)的雙重挑戰(zhàn)。對(duì)大數(shù)據(jù)中地質(zhì)數(shù)據(jù)及其應(yīng)用工作,面臨新時(shí)代下地質(zhì)資料管理的復(fù)雜背景,切實(shí)強(qiáng)化大數(shù)據(jù)信息化研究,進(jìn)行地質(zhì)資料管理,實(shí)現(xiàn)合理、有效的針對(duì)性分析,挖掘具有內(nèi)在價(jià)值的地質(zhì)資料,使得地質(zhì)資料管理由被動(dòng)向體現(xiàn)知識(shí)服務(wù)的轉(zhuǎn)變,能夠以更充分、更有效利用地質(zhì)資料,最終為社會(huì)發(fā)展提供更有力的支持和服務(wù)。
【關(guān)鍵詞】地質(zhì)大數(shù)據(jù) 地質(zhì)資料 信息化發(fā)展
地質(zhì)資料的數(shù)字資源主體是地質(zhì)調(diào)查工作形成的各種資料數(shù)據(jù),這是一種不同的數(shù)據(jù)格式,數(shù)據(jù)是地質(zhì)工作者的辛勤工作的結(jié)果,針對(duì)地理、地質(zhì)環(huán)境變化的記錄,是社會(huì)和國家安全的重要信息資源,包含難以估量的社會(huì)價(jià)值和經(jīng)濟(jì)價(jià)值。伴隨著互聯(lián)網(wǎng)和信息技術(shù)的發(fā)展,大數(shù)據(jù)越來越受到人們的關(guān)注和重視。來自大數(shù)據(jù)的信息風(fēng)暴正在改變我們的生活和工作,并迎來一個(gè)變革的重大時(shí)代,這將帶來思想和管理的變革。在大數(shù)據(jù)的地質(zhì)數(shù)據(jù)信息時(shí)代做好工作,實(shí)現(xiàn)地質(zhì)數(shù)據(jù)的高效管理、信息化運(yùn)作,通過合理的分析和挖掘地質(zhì)資料、強(qiáng)化地質(zhì)資料管理以及知識(shí)服務(wù)充分體現(xiàn)地質(zhì)數(shù)據(jù)的內(nèi)在價(jià)值和實(shí)用價(jià)值,進(jìn)而能夠更加充分、更加有效地利用地質(zhì)資料,從而能夠?yàn)樯鐣?huì)發(fā)展提供更多的有效的支持和服務(wù)。
1 大數(shù)據(jù)所具備的一般特征
1.1 數(shù)據(jù)量極其的龐大
對(duì)于一般的數(shù)據(jù)量而言,大數(shù)據(jù)它們的起初的計(jì)算量是相當(dāng)龐大的,這也是之所以“大”的重要原因。一般來說,它們的計(jì)量單位最起碼是在PB這個(gè)層級(jí),甚至有些數(shù)據(jù)量之大之多會(huì)一躍達(dá)到EB或者ZB層級(jí)(需要解釋的是1TB等同于1024GB,1PB等同于1024TB,1EB等同于1024PB,1ZB等同于1024EB),如果換算成具體的數(shù)據(jù)量,也就是說大數(shù)據(jù)能達(dá)到100萬GB、10億GB、1萬億GB的層級(jí),或者隨著計(jì)算機(jī)技術(shù)的不斷強(qiáng)大而呈現(xiàn)千倍躍升趨勢。依照當(dāng)今全球算得上權(quán)威的一些具備國際視野的數(shù)據(jù)公司進(jìn)行的最前衛(wèi)和最前沿的研究探索和統(tǒng)計(jì)分析結(jié)論,2013年全世界形成了0.49ZB的龐大數(shù)據(jù)量,而2014年上升為0.8ZB,到了2016年甚至越過1ZB大關(guān),達(dá)到1.82ZB,這個(gè)是相當(dāng)體量的數(shù)據(jù)量。著名的計(jì)算機(jī)公司IBM公司就數(shù)據(jù)的問題做過一個(gè)非常細(xì)微的研究和討論,他們公司通過大量的計(jì)算和統(tǒng)計(jì)最后給出了一個(gè)令人震驚、但比較準(zhǔn)確的論點(diǎn),就是我們整個(gè)入類所獲取的全部數(shù)據(jù)中,90%是過去兩年內(nèi)產(chǎn)生的;而且,這個(gè)公司通過預(yù)測,2020年全球產(chǎn)生的數(shù)據(jù)體量將達(dá)到現(xiàn)在的44倍之多。
1.2 價(jià)值密度低
我們知道,隨著經(jīng)濟(jì)的快速發(fā)展以及互聯(lián)網(wǎng)技術(shù)的廣泛而又大范圍的應(yīng)用,物聯(lián)網(wǎng)等新技術(shù)、新業(yè)態(tài)緊隨著產(chǎn)生或者發(fā)張壯大成為一個(gè)新鮮的事物并得到廣泛應(yīng)用,而這種結(jié)果會(huì)導(dǎo)致全人類的信息資源越來越多,所能夠形成的信息意識(shí)也越來越大,無處不在的信息和汗牛充棟的信息量無疑已經(jīng)走進(jìn)尋常百姓家。然而,很多信息的潛在價(jià)值和利用價(jià)值是比較低的,很多人所掌握的是比較碎片化的信息,因此利用起來比較麻煩。這就給日益發(fā)展壯大的大數(shù)據(jù)產(chǎn)業(yè)帶來很大的難題,因?yàn)檫@需要計(jì)算能力超強(qiáng)的機(jī)器還需要非常先進(jìn)的計(jì)算機(jī)算法,這樣才能真正體現(xiàn)數(shù)據(jù)的的意義和價(jià)值。
1.3 速度快時(shí)效高
處理速度和時(shí)間效率要求非常的高,是我們當(dāng)前的研究人員甚至是數(shù)據(jù)使用的公司人員對(duì)一些傳統(tǒng)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析挖掘所要實(shí)現(xiàn)的基本要求,也是其表現(xiàn)出來的顯著特點(diǎn)。我們都知道,在當(dāng)前這個(gè)時(shí)代,科學(xué)技術(shù)對(duì)于數(shù)據(jù)利用發(fā)揮巨大的作用,通過一定的技術(shù)架構(gòu)和比較規(guī)范的技術(shù)使用路徑人類是很難一次性去處理體量龐大的數(shù)據(jù)的,也得不到相應(yīng)的價(jià)值信息。通過前面的系統(tǒng)分析,我們可以得出一個(gè)結(jié)論,就是在大數(shù)據(jù)這個(gè)時(shí)代,對(duì)人類能力或者說頭腦提出了新的挑戰(zhàn),也提供了前所未有的發(fā)展的空間和巨大的潛力。
2 地質(zhì)資料數(shù)字資源特征
2.1 大量
信息技術(shù)的不斷完善,使得各種計(jì)算機(jī)設(shè)備、物聯(lián)網(wǎng)、云計(jì)算和云存儲(chǔ)技術(shù)逐漸提高了記錄數(shù)據(jù)的覆蓋范圍,并產(chǎn)生了大量的數(shù)據(jù)。截至2016年12月31日,全國地質(zhì)數(shù)據(jù)采集信息己達(dá)139830個(gè),占據(jù)TB存儲(chǔ)空間的14.9%,數(shù)據(jù)量為320 TB,包括生產(chǎn)數(shù)據(jù)、原始數(shù)據(jù)等備份數(shù)據(jù)交換。
2.2 高速
對(duì)大數(shù)據(jù)的發(fā)展趨勢是數(shù)據(jù)挖掘的前期工作,地質(zhì)數(shù)據(jù)的實(shí)時(shí)數(shù)據(jù)處理的結(jié)果,完整的產(chǎn)品數(shù)據(jù)提供及時(shí)、有效的數(shù)字資源服務(wù)的應(yīng)用程序,所以生產(chǎn)必須在數(shù)據(jù)處理快速高效的基礎(chǔ)上和過程中去實(shí)現(xiàn),越來越成為前端數(shù)據(jù)挖掘的同時(shí),感知預(yù)測提前提供的直接服務(wù)對(duì)象進(jìn)而實(shí)現(xiàn)個(gè)性化服務(wù)。
2.3 多樣
在大數(shù)據(jù)時(shí)代的數(shù)據(jù)格式也越來越多樣化,包括不同類型的數(shù)據(jù),如文本、音頻、圖像、視頻等,目前,全國地質(zhì)圖書館數(shù)字資源主要包括早期的紙介質(zhì)的地質(zhì)數(shù)據(jù)以及相當(dāng)一部分的電子數(shù)據(jù),近年來通過信息化手段使得電子地質(zhì)調(diào)查數(shù)據(jù)從包括文檔數(shù)據(jù)的電子數(shù)據(jù)、數(shù)據(jù)表和數(shù)據(jù)庫文件,從空間數(shù)據(jù)的類型分為矢量數(shù)據(jù)和柵格數(shù)據(jù),等等,同時(shí),這些專業(yè)的數(shù)據(jù)分類也很廣,包括海洋地質(zhì)調(diào)查、區(qū)域礦產(chǎn)勘查、調(diào)查,實(shí)現(xiàn)遠(yuǎn)程探測水環(huán)勘探,地質(zhì)科研,技術(shù)研究及相關(guān)專業(yè)。
2.4 價(jià)值
數(shù)據(jù)的大量地質(zhì)調(diào)查結(jié)果是投入的人力和財(cái)力數(shù)以萬計(jì),它包含了無法估量的社會(huì)價(jià)值和經(jīng)濟(jì)價(jià)值,所以這些珍貴的館藏地質(zhì)調(diào)查結(jié)果的數(shù)字資源進(jìn)行安全有效的存儲(chǔ)和保鮮的需要,保證數(shù)字資源本身的安全性,長期有效的使用。
3 大數(shù)據(jù)背景下地質(zhì)資料信息化發(fā)展現(xiàn)狀和面臨的挑戰(zhàn)
3.1 地質(zhì)資料信息化發(fā)展的需要以及當(dāng)前所處于的現(xiàn)狀
當(dāng)前發(fā)展的階段,緊隨著計(jì)算機(jī)技術(shù)以及信息技術(shù)廣泛而深入的融入到社會(huì)的方方面面,各種各樣的數(shù)據(jù)的產(chǎn)生、集聚、融合、發(fā)酵、爆發(fā)就順理成章地引發(fā)了“大數(shù)據(jù)時(shí)代”的來臨,成為我們?nèi)祟惷鎸?duì)的挑戰(zhàn)和享受的紅利。在這個(gè)高度發(fā)達(dá)、高度集中的大數(shù)據(jù)時(shí)代,地質(zhì)行業(yè)以其特殊的屬性和特有的數(shù)據(jù)管理、開發(fā)運(yùn)用以及社會(huì)服務(wù)等方面的實(shí)踐應(yīng)用和探索,也會(huì)隨著發(fā)生翻天覆地的變化。我們知道,地質(zhì)資料數(shù)據(jù)與傳統(tǒng)方式或者算法獲得的數(shù)據(jù)資源進(jìn)行比較,它具有特定的載體、特有的格式、特殊的渠道。對(duì)于一直通過手動(dòng)測量、計(jì)算機(jī)簡單儲(chǔ)存運(yùn)算的地質(zhì)數(shù)據(jù)而言,超體量的大數(shù)據(jù)資源,無疑對(duì)數(shù)據(jù)的管理和應(yīng)用提出了新的高度,帶來新的挑戰(zhàn)。一方面,地質(zhì)行業(yè)對(duì)大數(shù)據(jù)有著很強(qiáng)的依賴性,這個(gè)是時(shí)代進(jìn)步的產(chǎn)物,也是工業(yè)化、信息化的發(fā)展結(jié)晶,想必現(xiàn)在至不久的將來會(huì)有越來越多的地質(zhì)資料信息服務(wù)要求。另一個(gè)方面,信息技術(shù)發(fā)展到一定的高度對(duì)管理和服務(wù)提出了更高的要求,一旦相應(yīng)的配套跟不上會(huì)產(chǎn)生不必要的麻煩。如何有效地進(jìn)行儲(chǔ)存、查找和高效進(jìn)行運(yùn)用成為重要的課題。endprint
3.2 地質(zhì)資料海量數(shù)據(jù)的發(fā)現(xiàn)與提取難度加大
在大數(shù)據(jù)這個(gè)時(shí)代,計(jì)算機(jī)硬件不斷更新升級(jí),軟件資源也隨之翻新配套,使得各種各樣的數(shù)據(jù)量的陡然劇增,在某些方面由于現(xiàn)有技術(shù)和認(rèn)識(shí)的瓶頸問題甚至?xí)霈F(xiàn)數(shù)據(jù)“漲庫”的現(xiàn)象發(fā)生,一般意義上來說,隨著大數(shù)據(jù)將越來越多的地質(zhì)資料予以信息化處理而匯聚成龐大的信息化資源,這就需要相關(guān)的配套設(shè)施和措施要加速進(jìn)行和迅速的推進(jìn),如果不能達(dá)到要求,但需要一個(gè)地質(zhì)資料信息的時(shí)候,盡管能夠進(jìn)行相應(yīng)的檢索,但檢索出來數(shù)據(jù)之多、體量之大難以進(jìn)行有效的應(yīng)用,甚至有些數(shù)據(jù)會(huì)被埋沒在海量的干擾項(xiàng)之中,如何快速地進(jìn)行海量數(shù)據(jù)的檢索而又能夠準(zhǔn)確快速高效地找到有用的信息也成為當(dāng)前所面臨的問題。
4 大數(shù)據(jù)支持下的地質(zhì)信息化關(guān)鍵要素
4.1 地質(zhì)云平臺(tái)
簡單的講,地質(zhì)云就是借助通過一般地勘測、統(tǒng)計(jì)、分析所得到的地質(zhì)、礦產(chǎn)、物理等數(shù)據(jù),或者是通過一些高科技手段以及技術(shù)諸如遙感等信息技術(shù)所獲得的數(shù)據(jù),對(duì)地質(zhì)、水文等相關(guān)環(huán)境資源以及災(zāi)害信息的相關(guān)數(shù)據(jù)的匯總和集合。比如說,當(dāng)我們想了解一個(gè)區(qū)域的地形地貌、資源儲(chǔ)備等地質(zhì)數(shù)據(jù)的時(shí)候,我們會(huì)通過勘測、匯集或者通過大數(shù)據(jù)應(yīng)用和服務(wù),把能夠獲取到的數(shù)據(jù)進(jìn)行充分的整合、傳輸、分析、研究、提取,建立一個(gè)基于地質(zhì)數(shù)據(jù)、應(yīng)用于地質(zhì)服務(wù)的平臺(tái),這種平臺(tái)就是地質(zhì)云平臺(tái)。它往往能夠?qū)崿F(xiàn)從數(shù)據(jù)到信息、信息到知識(shí)、知識(shí)到智慧的轉(zhuǎn)換,為多角度、多層次的服務(wù)于生產(chǎn)生活打下堅(jiān)實(shí)基礎(chǔ)。
4.2 大數(shù)據(jù)應(yīng)用服務(wù)系統(tǒng)
建立一個(gè)大型的地質(zhì)數(shù)據(jù)的應(yīng)用服務(wù)系統(tǒng),使用3S的技術(shù)、網(wǎng)絡(luò)技術(shù)、云計(jì)算技術(shù)等,如集成地質(zhì)資料信息集成、深加工產(chǎn)品服務(wù),研究和發(fā)展大型地質(zhì)數(shù)據(jù)和相關(guān)分析,更方便地進(jìn)行數(shù)據(jù)挖掘使得獲取到的數(shù)據(jù)更有價(jià)值、有具實(shí)效性,而往往通過這樣途徑所獲取的數(shù)據(jù)能夠?yàn)槲覀兲峁┤轿坏纳a(chǎn)生活服務(wù)和智能決策支持。
4.3 S技術(shù)標(biāo)準(zhǔn)體系
眾所周知,在一些空間信息管理、轉(zhuǎn)化、共享、應(yīng)用等方面某些關(guān)鍵技術(shù)發(fā)揮了極其重要的基礎(chǔ)作用,無獨(dú)有偶,在地質(zhì)大數(shù)據(jù)建設(shè)方面同樣需要這樣的一些技術(shù)和服務(wù)。而且,在數(shù)據(jù)應(yīng)用過程中必須遵循一定的技術(shù)標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn),只有這樣才能夠使得地質(zhì)大數(shù)據(jù)的應(yīng)用能形成統(tǒng)一的格式、界面或者是安全、開放的標(biāo)準(zhǔn),只有這樣才能為數(shù)據(jù)的開放共享、安全運(yùn)用奠定堅(jiān)實(shí)的基礎(chǔ)。當(dāng)然,在統(tǒng)一、規(guī)范的過程中,會(huì)涉及一些諸如智能識(shí)別、遙感地質(zhì)、描述分類、協(xié)作共享、服務(wù)協(xié)議等方面的標(biāo)準(zhǔn)和規(guī)范,要注重這些項(xiàng)目的統(tǒng)一與協(xié)調(diào)發(fā)展。同時(shí),建立系統(tǒng)完善的技術(shù)標(biāo)準(zhǔn)體系,要注重包含地質(zhì)資料的分類、收集、存儲(chǔ)、互動(dòng)和服務(wù)等一些基本的要素,在此基礎(chǔ)上構(gòu)建基本標(biāo)準(zhǔn)和信息共享與服務(wù)標(biāo)準(zhǔn)。
5 大數(shù)據(jù)時(shí)代地質(zhì)資料信息化建設(shè)的有效策略
5.1 做好數(shù)字化轉(zhuǎn)換
數(shù)字化是信息化建設(shè)的前提和基礎(chǔ),做好數(shù)字轉(zhuǎn)換的信息,可以通過數(shù)字技術(shù)的應(yīng)用給支持信息系統(tǒng)。中國目前有比較豐富的地質(zhì)資料,只根據(jù)數(shù)據(jù)管理的傳統(tǒng)方法是保證所有的地質(zhì)數(shù)據(jù)的有效應(yīng)用非常困難,所以數(shù)字發(fā)展成為地質(zhì)資料的地質(zhì)數(shù)據(jù)。在數(shù)字化轉(zhuǎn)型過程中的地質(zhì)資料,相關(guān)人員需要在原始地質(zhì)資料做一份好的工作,許多地質(zhì)數(shù)據(jù)的分類可以通過掃描,在輸入和輸入的形式,但仍然存在的地質(zhì)數(shù)據(jù)轉(zhuǎn)化利用現(xiàn)代數(shù)字技術(shù)的一小部分,在處理這部分?jǐn)?shù)據(jù)的過程中,工作人員可以編輯目錄,這樣我們就可以在一定程度上,提高地質(zhì)資料管理和搜索效率。
5.2 強(qiáng)化知識(shí)創(chuàng)新
我國部分地區(qū)已經(jīng)建立了數(shù)字檔案館,通過互聯(lián)網(wǎng)進(jìn)行信息共享。但需要注意的是,隨著現(xiàn)代信息技術(shù)的提高,傳統(tǒng)的數(shù)字檔案顯示出一定的滯后性,因此在數(shù)字圖書館建設(shè)過程中的地質(zhì)資料,除了對(duì)數(shù)字圖書館的基礎(chǔ)建設(shè)工作,也是提高數(shù)字信息管理的功能,增加系統(tǒng)的數(shù)字圖書館服務(wù),加強(qiáng)和整合知識(shí)的分類。尤地質(zhì)數(shù)據(jù)數(shù)字?jǐn)?shù)據(jù)庫主要提供知識(shí)服務(wù),需要對(duì)其進(jìn)行適當(dāng)擴(kuò)充,不斷提高知識(shí)服務(wù)的需求。
(1)提高數(shù)字圖書館的主動(dòng)服務(wù),為用戶服務(wù)的過程中,主動(dòng)管理和查詢信息,滿足用戶需求,提高用戶的感知信息,從信息,更有利于深入的知識(shí);
(2)加強(qiáng)對(duì)普通的知識(shí)管理,在編輯和在煉制過程中地質(zhì)資料中的應(yīng)用,簡化了現(xiàn)有的信息,合理整合,提高創(chuàng)新知識(shí),使地質(zhì)數(shù)據(jù)在網(wǎng)絡(luò)環(huán)境下得到更好的開發(fā)和利用。
5.4 做好保障支撐
網(wǎng)絡(luò)技術(shù)的飛速發(fā)展徹底改變了傳統(tǒng)的辦公和管理模式。由于地質(zhì)資料的保密性,各級(jí)采集機(jī)構(gòu)應(yīng)根據(jù)數(shù)字資源地質(zhì)數(shù)據(jù)的特點(diǎn),對(duì)網(wǎng)絡(luò)系統(tǒng)的內(nèi)外網(wǎng)進(jìn)行單獨(dú)的網(wǎng)絡(luò)建設(shè)。內(nèi)部網(wǎng)絡(luò)物理隔離,并參考分類網(wǎng)絡(luò)的建設(shè)和管理,接收的主要實(shí)現(xiàn)方式,對(duì)數(shù)字資源加工等為主要業(yè)務(wù)的地質(zhì)數(shù)據(jù)管理;外部網(wǎng)絡(luò)用于互聯(lián)網(wǎng)門戶網(wǎng)站發(fā)布的服務(wù)支持,實(shí)現(xiàn)傳播、共享、查詢和在線地質(zhì)數(shù)據(jù)資源編輯。因此,利用光纖鏈路提供基本支持,機(jī)房專用用戶管理采用屏蔽線提供客戶端的網(wǎng)絡(luò)鏈路保護(hù)。數(shù)據(jù)一方面,以加強(qiáng)備份速度的安全措施為參考,設(shè)置全備份策略、備份和全局差分增量備份相結(jié)合,有效保護(hù)數(shù)字資源安全。另一方面,要加強(qiáng)信息安全措施,提高管理技術(shù)機(jī)密和保密意識(shí)水平,不定期組織計(jì)算機(jī)分類的自我審核,分區(qū)和加強(qiáng)對(duì)工作環(huán)境的管理,實(shí)現(xiàn)工作區(qū)域沒有任何互聯(lián)網(wǎng)連接。
參考文獻(xiàn)
[1]盛揚(yáng)燕,周濤[譯].大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2012.
[2]劉曉鴻,地質(zhì)大數(shù)據(jù)應(yīng)用與地質(zhì)信息化發(fā)展的思考[J].中國礦業(yè),2016,11.
[3]王黔駒,地質(zhì)資料信息化建設(shè)對(duì)策[J],中國國土資源經(jīng)濟(jì),2016 (01).
[4]朱衛(wèi)紅,美國地質(zhì)資料信息服務(wù)發(fā)展研究[J].中國礦業(yè),2013,22(09).
[5]丁克永等,地質(zhì)資料信息服務(wù)集群化產(chǎn)業(yè)化的理論與實(shí)踐[M].北京:科學(xué)出版社.2014.endprint