雷傳揚(yáng), 王 靜, 謝海洋, 王 波, 范 敏
(1.四川省地質(zhì)調(diào)查院 稀有稀土戰(zhàn)略資源評(píng)價(jià)與利用四川省重點(diǎn)實(shí)驗(yàn)室,四川 成都 610081;2.四川省地礦局四〇五地質(zhì)隊(duì),四川 都江堰 611830; 3.四川省地礦局一〇九地質(zhì)隊(duì),四川 成都 610100)
地質(zhì)資料是地質(zhì)工作者認(rèn)知地球信息的集合體,承載著巨大的投入和智慧,是客觀記錄與主觀認(rèn)知的綜合體現(xiàn),是地質(zhì)學(xué)科學(xué)價(jià)值的表現(xiàn)載體和地質(zhì)工作服務(wù)社會(huì)的主要載體,在國民經(jīng)濟(jì)建設(shè)和地質(zhì)科學(xué)研究中具有重要的價(jià)值[1-4]。地質(zhì)資料在傳承地質(zhì)工作成果的同時(shí),在其他相關(guān)領(lǐng)域也有較好的發(fā)展前景,需要不斷擴(kuò)展傳統(tǒng)地質(zhì)資料應(yīng)用服務(wù)范圍,將“跨界交叉”作為實(shí)施“地質(zhì)資料二次開發(fā)”的戰(zhàn)略,推進(jìn)地質(zhì)資料在更廣范圍、更多領(lǐng)域發(fā)揮其基礎(chǔ)支撐作用[5-6]。新中國成立以來,黨和國家高度重視地質(zhì)工作,地質(zhì)勘查和科學(xué)研究成就顯著,形成了海量的地質(zhì)資料,分散存儲(chǔ)在全國地質(zhì)資料館、各省級(jí)地質(zhì)資料館、科研機(jī)構(gòu)及高校資料館、各類地質(zhì)勘查單位和礦山企業(yè)[7-8],信息分散,不利于地質(zhì)資料的社會(huì)化服務(wù)。隨著社會(huì)經(jīng)濟(jì)的高速發(fā)展,對(duì)地質(zhì)資料的開發(fā)利用提出了更高的要求,尤其是在地球科學(xué)研究、工程建設(shè)、生態(tài)環(huán)境保護(hù)、城市發(fā)展、防災(zāi)減災(zāi)、災(zāi)后重建、政府決策和科學(xué)管理等方面[9]。充分開發(fā)利用存量地質(zhì)資料,能極大的減小地質(zhì)工作風(fēng)險(xiǎn),減少重復(fù)工作和投入,避免不必要的浪費(fèi)。
本次依托成都市城市地下空間資源地質(zhì)調(diào)查應(yīng)用系統(tǒng)開發(fā)及數(shù)據(jù)整合建庫項(xiàng)目,開展了成都市地質(zhì)大數(shù)據(jù)建庫存量資料收集與整理方法研究,在開展資料收集和整理工作的前期階段,項(xiàng)目組在充分借鑒地質(zhì)云前期數(shù)據(jù)整理工作和規(guī)范的基礎(chǔ)上,結(jié)合成都市實(shí)際情況編制了《成都市地質(zhì)資料收集與整理規(guī)范》《成都市地質(zhì)資料標(biāo)準(zhǔn)化處理辦法》《成都市巖土體結(jié)構(gòu)分層標(biāo)準(zhǔn)》和《成都市城市地下空間資源地質(zhì)調(diào)查數(shù)據(jù)庫建設(shè)指南》。本文簡述了成都市存量地質(zhì)資料的現(xiàn)狀,深入分析了成都市地質(zhì)大數(shù)據(jù)建庫工作對(duì)資料內(nèi)容及格式的要求,結(jié)合成都市存量地質(zhì)資料的特征,總結(jié)了一套存量地質(zhì)資料收集與整理的有效方法,顯著提高了工作效率和質(zhì)量,以期能早日實(shí)現(xiàn)成都市地質(zhì)大數(shù)據(jù)社會(huì)化服務(wù)與共享。
地質(zhì)資料是指在地質(zhì)工作中形成的,以文字、圖表、聲像、電磁介質(zhì)等形式存在的各類原始地質(zhì)資料、成果地質(zhì)資料,以及巖礦心、標(biāo)本、光薄片、樣品等實(shí)物地質(zhì)資料,是地質(zhì)工作形成的重要基礎(chǔ)信息資源,具有可被重復(fù)開發(fā)利用、能夠長期提供服務(wù)的重要功能[10-11]。隨著近年來信息技術(shù)的快速發(fā)展,尤其是大數(shù)據(jù)、云技算和人工智能等信息技術(shù)的發(fā)展,地質(zhì)調(diào)查工作更多的依靠信息技術(shù)來完成,形成的地質(zhì)資料具有數(shù)據(jù)量大、類型格式多樣、重復(fù)利用率和潛在價(jià)值高等特點(diǎn)[12],是國家重要基礎(chǔ)性、戰(zhàn)略性信息資源和大數(shù)據(jù)戰(zhàn)略數(shù)據(jù)基礎(chǔ)的重要組成部分[13],但受時(shí)間、技術(shù)、地域、國家政策和自然及人為災(zāi)害等客觀和主觀因素的影響,地質(zhì)資料現(xiàn)狀復(fù)雜。目前成都市存量地質(zhì)資料保管分散、共享服務(wù)渠道不暢、產(chǎn)品和服務(wù)形式單一、開發(fā)利用程度整體偏低,導(dǎo)致存量地質(zhì)資料的潛在價(jià)值得不到充分發(fā)揮。
主要表現(xiàn)在地勘行業(yè)管理體制和運(yùn)行機(jī)制存在多個(gè)歷史時(shí)期的改革,具歸口管理單位多,各單位駐地分散,資料保管條件參差不齊等特點(diǎn)[14-15]。其中歸口管理單位有中央和地方的國土、規(guī)劃、地礦、冶金、煤田、核工業(yè)、化工、建材、地震、測(cè)繪、石油、林業(yè)、農(nóng)業(yè)、鐵路、公路交通、水電等十多個(gè)部門,各單位在全國各地均有分布[16]。全國范圍內(nèi),多年以來形成的地質(zhì)資料沒有統(tǒng)一匯交,在各單位資料館分散保存,形成眾多的信息孤島,缺少共建平臺(tái)和共享機(jī)制,其價(jià)值未能有效挖掘。數(shù)據(jù)信息化程度低,利用率低,未能形成大數(shù)據(jù)效應(yīng)[7, 17]。
通過本次調(diào)研,成都市存量地質(zhì)資料保存在不同的資料管理部門,如地質(zhì)調(diào)查局成都中心資料館、四川省自然資源廳資料館、成都理工大學(xué)資料館、地礦局、冶金局、煤田局、核工業(yè)局、建材中心、化工院、鹽業(yè)鉆井大隊(duì)、城建、交通、測(cè)繪、規(guī)劃等檔案管理部門,甚至少部分資料還保存在單位二級(jí)實(shí)體部門,沒有向上級(jí)匯交,且部分存量地質(zhì)資料為涉密資料,在資料的保管、借閱方面均需要辦理相應(yīng)保密手續(xù),為成都市地質(zhì)大數(shù)據(jù)建庫資料收集整理、組織協(xié)調(diào)、技術(shù)方法的選擇等各個(gè)方面增加了難度,大大提高了建設(shè)成本。
自建國以來,成都地區(qū)開展了大量地質(zhì)工作,為成都市的建設(shè)和發(fā)展做出了巨大貢獻(xiàn),形成了大量的地質(zhì)資料(表1),其中2003年以前形成的資料主要以紙介質(zhì)檔案排架式管理保存,存儲(chǔ)占用空間大,對(duì)館藏環(huán)境要求高,受成都地區(qū)氣候潮濕影響,部分資料老化、磨損嚴(yán)重,導(dǎo)致資料無法正常使用或丟失;近年來國家對(duì)地質(zhì)資料歸檔管理工作越來越重視,相繼出臺(tái)了《地質(zhì)資料管理?xiàng)l例》和《地質(zhì)資料管理?xiàng)l例實(shí)施辦法》,2003年以后形成的資料包括紙介質(zhì)和電子文檔兩大類,但電子文檔資料形成的軟件系統(tǒng)和平臺(tái)各異,為地質(zhì)資料的篩選、應(yīng)用和數(shù)據(jù)標(biāo)準(zhǔn)化帶來巨大困難。大部分館藏機(jī)構(gòu)對(duì)存量地質(zhì)資料的綜合研究工作尚未全面開展,嚴(yán)重影響了存量地質(zhì)資料的二次開發(fā)利用。
地質(zhì)資料電子數(shù)據(jù)的文件格式是電子數(shù)據(jù)能否長期可用和持續(xù)使用的關(guān)鍵技術(shù)因素[11]。目前收集到的電子文檔資料主要存在文本、矢量、柵格和數(shù)據(jù)庫四種格式。成果報(bào)告以文本格式為主,有Word、WPS、TXT等格式,附表為不同版本的Excel表格;圖件以矢量和柵格格式為主,矢量圖件有MapGIS、ArcGIS、AutoCAD等格式,柵格圖件以JPG、BMP、TIFF、GRD、GRD2、GGD等格式為主;存儲(chǔ)結(jié)構(gòu)化屬性數(shù)據(jù)的數(shù)據(jù)庫類型多樣,有Oracle、Informix、DB2、SQL-Server、Access、Sybase等類型,元數(shù)據(jù)為MXL格式。格式的多樣性導(dǎo)致電子數(shù)據(jù)存在可持續(xù)使用、變更、版權(quán)使用和支撐環(huán)境保障等風(fēng)險(xiǎn)[11]。
表1 成都市存量地質(zhì)資料調(diào)研情況統(tǒng)計(jì)
存量地質(zhì)資料數(shù)據(jù)所采用的空間坐標(biāo)系不統(tǒng)一,存在北京54坐標(biāo)系、西安80坐標(biāo)系、2000國家大地坐標(biāo)系、WGS-84坐標(biāo)系、成都地方坐標(biāo)系等。
受西部龍門山造山帶、東部龍泉山斷裂帶影響,成都地區(qū)地質(zhì)構(gòu)造復(fù)雜。不同時(shí)期,不同地質(zhì)學(xué)者對(duì)成都地區(qū)地層劃分認(rèn)識(shí)不一致,同一地層在不同時(shí)期、不同區(qū)域的資料中命名不一致,導(dǎo)致存量地質(zhì)資料中部分地層、巖層歸屬甄別難度較大,需要經(jīng)驗(yàn)豐富的專家根據(jù)不同資料中地層的巖性、巖相和巖石組合特征重新建立成都地區(qū)的地層劃分標(biāo)準(zhǔn),對(duì)存量地質(zhì)資料中歸屬存在疑問的地層、巖層進(jìn)行重新劃分。
存量地質(zhì)資料的收集應(yīng)加強(qiáng)資料質(zhì)量與實(shí)效的控制,有效擴(kuò)大收集范圍。根據(jù)成都市全域三維地質(zhì)框架模型和成都市城市地質(zhì)調(diào)查區(qū)三維地質(zhì)模型建設(shè)工作的需要,本次資料收集范圍為成都市行政區(qū)域(含簡陽市)全域,總面積14 335 km2(全域三維地質(zhì)框架模型建設(shè)范圍),其中成都市“中優(yōu)”“北改”“南拓”“東進(jìn)”的全部范圍和郫都區(qū)、溫江區(qū)、金堂縣、簡陽市的部分區(qū)域以及其他區(qū)、市、縣城市建設(shè)規(guī)劃區(qū)為重點(diǎn)收集范圍(成都市城市地質(zhì)調(diào)查區(qū)三維地質(zhì)模型建設(shè)范圍),其他區(qū)域?yàn)橐话闶占秶?圖1)。
系統(tǒng)收集工作區(qū)地上、地下相關(guān)存量地質(zhì)資料,包括地質(zhì)類(基礎(chǔ)地質(zhì)、礦產(chǎn)地質(zhì)、水文地質(zhì)、工程地質(zhì)、環(huán)境地質(zhì)、災(zāi)害地質(zhì)、地球物理、地球化學(xué)、遙感地質(zhì)),城建及交通類(城建規(guī)劃、工業(yè)與民用建筑、道路工程、綠化工程、排水工程、給水工程、隧道工程、交通設(shè)施工程、污水處理工程、防洪工程、供電及照明工程等),地下空間開發(fā)利用現(xiàn)狀類,以及與地質(zhì)相關(guān)的基礎(chǔ)地理、氣象水文等方面的相關(guān)資料,其中鉆孔資料、剖面資料、各類測(cè)試數(shù)據(jù)、綜合研究報(bào)告為重點(diǎn)收集對(duì)象。
以地下空間地質(zhì)資源調(diào)查需求為導(dǎo)向,地質(zhì)大數(shù)據(jù)建庫工作需要為原則收集資料,做到及時(shí)收集、整理、提交各類資料。為進(jìn)一步明確資料收集范圍和收集內(nèi)容,首先對(duì)工作區(qū)內(nèi)所有地質(zhì)資料的館藏機(jī)構(gòu)進(jìn)行全面摸排,以四川省自然資源資料館、成都市城建檔案館、成都市勘測(cè)設(shè)計(jì)院資料館,四川省地質(zhì)礦產(chǎn)開發(fā)局資料館,中國地質(zhì)調(diào)查局西南地質(zhì)資料館,四川省地質(zhì)調(diào)查院資料館等為重點(diǎn)對(duì)象,掌握地質(zhì)資料的儲(chǔ)存和分布情況,包括:館藏機(jī)構(gòu)和項(xiàng)目承擔(dān)單位的基本情況;項(xiàng)目名稱及完成時(shí)間;項(xiàng)目開展區(qū)域;項(xiàng)目所屬領(lǐng)域和涵蓋專業(yè);資料密級(jí);資料主要內(nèi)容。分析館藏機(jī)構(gòu)的資料臺(tái)賬,初步篩選出可收集的資料,并列出擬收集資料清單。篩選原則:承擔(dān)單位有沒有完善的質(zhì)量管理體系和質(zhì)量監(jiān)控措施;地質(zhì)要素在區(qū)域上是否具有延續(xù)性,篩選相鄰區(qū)域資料作為綜合研究的參考依據(jù);根據(jù)資料的勘查階段和完成時(shí)間判斷資料的時(shí)效性、可利用性,部分或全部重疊工作區(qū)類似資料優(yōu)選工作程度較高、完成時(shí)間較晚的資料;從資料涵蓋的專業(yè)和工作程度初步判斷資料的可利用性。
圖1 資料收集范圍示意
大數(shù)據(jù)的核心是資料的匯聚,如果資料本身不準(zhǔn)確,就可能導(dǎo)致錯(cuò)誤的分析、預(yù)測(cè)和決策結(jié)果,所以全面的、精準(zhǔn)的數(shù)據(jù)資料是大數(shù)據(jù)的基礎(chǔ)[20-21]。資料整理的目的是保證入庫資料的真實(shí)性、準(zhǔn)確性、完整性、統(tǒng)一性和簡明性,為成都市地質(zhì)大數(shù)據(jù)庫建設(shè)工作順利推進(jìn)提供保障。
針對(duì)成都市存量地質(zhì)資料的現(xiàn)狀與特點(diǎn),根據(jù)《成都市城市地下空間資源地質(zhì)調(diào)查數(shù)據(jù)庫建設(shè)指南》《成都市地質(zhì)資料收集與整理規(guī)范》《成都市地質(zhì)資料標(biāo)準(zhǔn)化處理辦法》和《成都市巖土體結(jié)構(gòu)分層標(biāo)準(zhǔn)》等的要求,結(jié)合成都市城市地質(zhì)數(shù)據(jù)庫建設(shè)、三維地質(zhì)模型建設(shè)和城市地質(zhì)信息系統(tǒng)體系建設(shè)工作的需要,提出存量地質(zhì)資料整理的總體思路是“全盤考慮、統(tǒng)籌兼顧”,即資料收集、資料整理和標(biāo)準(zhǔn)化入庫,綜合考慮不同環(huán)節(jié)之間的協(xié)調(diào)與銜接。資料整理初期選擇不同類型的少量資料先行整理作為試點(diǎn),試點(diǎn)過程中注重發(fā)現(xiàn)問題、研究問題、解決問題,最終形成了一套快捷有效的整理方法,并通過專家評(píng)審,然后再全面推進(jìn)資料整理工作。詳細(xì)的方法流程見圖2。
將收集到的存量地質(zhì)資料進(jìn)行初步整理,為下一步資料分類和標(biāo)準(zhǔn)化整理工作作好準(zhǔn)備。
1.完整性
由于資料材質(zhì)等內(nèi)因加之保存時(shí)間過長和生物因素、物理因素、化學(xué)因素等外因作用導(dǎo)致資料有缺失、損壞的情況[22],對(duì)于缺失關(guān)鍵信息和重要信息的資料,本次不予利用。
2.識(shí)別度
部分原始地質(zhì)資料,可能出現(xiàn)字跡潦草,或者雨天作業(yè)紙張淋濕等各種主觀、客觀原因,導(dǎo)致資料關(guān)鍵信息無法準(zhǔn)確識(shí)別,整理人員不能憑主觀臆斷提取這類資料的信息,不予利用。
3.準(zhǔn)確性
根據(jù)已有成果資料和綜合研究成果,結(jié)合地質(zhì)背景,按照不同時(shí)期地質(zhì)工作技術(shù)標(biāo)準(zhǔn)要求對(duì)資料信息進(jìn)行綜合比較分析,存在明顯錯(cuò)誤的資料不予利用。
4.可利用性
主要針對(duì)鉆孔資料:(1)無坐標(biāo)或高程,不能準(zhǔn)確定位的鉆孔資料不予利用;(2)優(yōu)選利用打到基巖或特殊地質(zhì)體(如軟弱層、膏鹽層)的鉆孔資料;(3)選擇符合網(wǎng)格密度條件的鉆孔資料,以成都市新版地理底圖(400 m×400 m網(wǎng)格)為基礎(chǔ),每網(wǎng)格鉆孔數(shù)量≤10個(gè),鉆孔間距>50 m,優(yōu)先選擇同一項(xiàng)目的深孔資料(孔深≥30 m),如果單個(gè)網(wǎng)格內(nèi)深孔數(shù)量不能滿足要求,可選擇孔深接近30 m的鉆孔彌補(bǔ)空白;(4)位于水域或河灘的鉆孔重點(diǎn)利用;(5)包含重要試驗(yàn)類型的鉆孔資料,如注水試驗(yàn)、抽水試驗(yàn)、載荷試驗(yàn)、波速測(cè)試等全部利用。
5.重復(fù)性
同一地區(qū)開展過多次地質(zhì)工作,形成重復(fù)的地質(zhì)資料,優(yōu)先利用工作程度較高、研究程度較深、開展時(shí)間較晚的資料。
為了資料標(biāo)準(zhǔn)化整理工作的順利進(jìn)行,需要對(duì)通過初檢的資料進(jìn)行分類。
1.資料完整度分類
資料完整度分類:(1)完整,主體專業(yè)內(nèi)容完整,各類分析測(cè)試和動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)等重要參數(shù)齊全(優(yōu));(2)基本完整,主體專業(yè)內(nèi)容完整,但是重要參數(shù)需在報(bào)告、附圖、附件或附表中提取(良);(3)基本完整,主體專業(yè)內(nèi)容完整,但是重要參數(shù)需要從附近區(qū)域情況類似的報(bào)告或其他資料中引用(合格);(4)不完整,主體專業(yè)內(nèi)容缺失,文件損壞或重要參數(shù)無法查詢和引用(不合格)。
2.資料準(zhǔn)確性識(shí)別分類
對(duì)具有多解性的物探成果資料,需要與鉆探、原位測(cè)試、室內(nèi)試驗(yàn)成果等資料進(jìn)行對(duì)比分析,相互驗(yàn)證,并結(jié)合地質(zhì)背景和區(qū)域上已有成果資料對(duì)其準(zhǔn)確性進(jìn)行綜合判別,保障數(shù)據(jù)和成果資料的準(zhǔn)確性。資料準(zhǔn)確性識(shí)別分類:(1)優(yōu)先利用準(zhǔn)確釋義類資料;(2)具有多重解釋的資料作為備用。
3.資料內(nèi)容規(guī)范性鑒別分類
根據(jù)國家或行業(yè)標(biāo)準(zhǔn)規(guī)范對(duì)資料內(nèi)容表達(dá)的規(guī)范性進(jìn)行鑒別。資料內(nèi)容規(guī)范性鑒別分類:(1)優(yōu)先利用按標(biāo)準(zhǔn)規(guī)范執(zhí)行的資料;(2)備選未按照標(biāo)準(zhǔn)規(guī)類執(zhí)行的資料。
圖2 資料整理流程示意
資料標(biāo)準(zhǔn)化整理是一個(gè)去偽存真、去粗取精、由表及里、綜合提高的過程,可以有效提高資料的濃縮度、清晰度和準(zhǔn)確度,從而大大提高資料的使用價(jià)值。資料整理過程中要保障資料的真實(shí)性、準(zhǔn)確性、完整性、統(tǒng)一性和簡明性。保障資料的真實(shí)性是資料整理和分析的根本要求;保障資料的準(zhǔn)確性和完整性,可以有效避免因資料分析產(chǎn)生假象,從而影響后續(xù)綜合研究和三維建模的準(zhǔn)確性;采用統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范,統(tǒng)一的格式對(duì)資料進(jìn)行整理,整理好的資料采用統(tǒng)一的命名規(guī)則進(jìn)行命名;資料盡可能簡單、明了,該用文字說明的用文字說明,該用表格的用表格,該用圖表的用圖表,做到類別分明。
對(duì)可利用類、時(shí)效性新且資料完整度為“優(yōu)、良、合格”的資料進(jìn)行標(biāo)準(zhǔn)化整理,根據(jù)資料的數(shù)據(jù)結(jié)構(gòu)、類型將其分為文本、圖件和數(shù)據(jù)庫三類:(1)資料采用統(tǒng)一的標(biāo)準(zhǔn)、規(guī)范及格式進(jìn)行整理。(2)標(biāo)準(zhǔn)化整理好的資料采用統(tǒng)一格式命名。文本類和柵格圖像類(包括掃描形成的)文件采用館藏單位名稱_原始資料檔號(hào)(或成果資料檔號(hào))_資料名稱_檔內(nèi)順序號(hào)。矢量數(shù)據(jù)文件采用館藏單位名稱+原始資料檔號(hào)(或成果資料檔號(hào))+原始數(shù)據(jù)命名規(guī)則。(3)不同的資料標(biāo)準(zhǔn)化整理之后都要形成對(duì)應(yīng)的元數(shù)據(jù)文件。
1.文本資料
針對(duì)存量資料包括電子版和紙介質(zhì)兩種類型,且電子資料格式具多樣性的特征。首先將紙介質(zhì)資料進(jìn)行掃描,形成PDF格式文檔,成果報(bào)告等重要的資料作識(shí)別處理,轉(zhuǎn)換成可編輯的文本格式,再將Word、WPS、TXT等可編輯的資料統(tǒng)一轉(zhuǎn)為Word 2016格式;表格資料主要包括原始記錄表、分析測(cè)試記錄表,不同時(shí)期、不同項(xiàng)目形成的表格資料其數(shù)據(jù)項(xiàng)、坐標(biāo)系統(tǒng)和計(jì)量單位等都存在較大差異,根據(jù)《成都市城市地下空間資源地質(zhì)調(diào)查數(shù)據(jù)庫建庫指南》和《成都市地質(zhì)資料標(biāo)準(zhǔn)化處理辦法》相關(guān)要求建立標(biāo)準(zhǔn)的Excel 2016表格,包括統(tǒng)一表格數(shù)據(jù)項(xiàng)、坐標(biāo)系統(tǒng)、計(jì)量單位等內(nèi)容,再將原表格資料中的數(shù)據(jù)提取到標(biāo)準(zhǔn)表格中,提取過程中要保障數(shù)據(jù)的一致性和準(zhǔn)確性。
2.圖件資料
圖件資料包括柵格文件和矢量文件兩種類型。柵格文件中的地質(zhì)圖、工程布置圖、勘探線剖面圖、綜合柱狀圖、綜合剖面圖、儲(chǔ)量估算圖等重要圖件采用MapGIS 6.7軟件矢量化,柵格照片文件統(tǒng)一轉(zhuǎn)換為JPEG格式,分辯率≥200dpi。矢量文件統(tǒng)一轉(zhuǎn)換成MapGIS 6.7格式,并根據(jù)《成都市城市地下空間資源地質(zhì)調(diào)查數(shù)據(jù)庫建庫指南》和《成都市地質(zhì)資料標(biāo)準(zhǔn)化處理辦法》相關(guān)要求,統(tǒng)一圖件的坐標(biāo)系統(tǒng)、圖層劃分、圖庫等內(nèi)容。
3.數(shù)據(jù)庫資料
針對(duì)數(shù)據(jù)庫類型多樣的問題,需要將不同源數(shù)據(jù)庫中的數(shù)據(jù)信息轉(zhuǎn)換到城市地質(zhì)數(shù)據(jù)庫進(jìn)行存儲(chǔ)。根據(jù)《成都市城市地質(zhì)調(diào)查數(shù)據(jù)庫建庫指南》相關(guān)要求,對(duì)不同的數(shù)據(jù)源進(jìn)行分析處理,統(tǒng)一數(shù)據(jù)投影參數(shù);統(tǒng)一數(shù)據(jù)屬性字段、數(shù)據(jù)類型與長度、約束條件、值域范圍,統(tǒng)一數(shù)據(jù)內(nèi)容表達(dá)。
標(biāo)準(zhǔn)化整理好的資料根據(jù)文件夾設(shè)置分門別類地存儲(chǔ),資料一共分四級(jí)存儲(chǔ),分述如下:(1)一級(jí)文件夾以專業(yè)類型命名;(2)二級(jí)文件夾以項(xiàng)目名稱命名;(3)三級(jí)文件夾分別建立審批類、正文類、附圖類、附表類、附件類、數(shù)據(jù)庫和軟件類、多媒體類、原始資料類等八個(gè)資料類別文件夾;(4)四級(jí)文件夾根據(jù)資料內(nèi)容的實(shí)際需要設(shè)置。
收集的部分電子文檔資料存在單文件中包含多個(gè)項(xiàng)目的資料,或一個(gè)項(xiàng)目的資料存放在不同文件中的現(xiàn)象,需要整理人員再次進(jìn)行詳細(xì)的梳理,分別整理不同項(xiàng)目的資料,這項(xiàng)工作需要投入較多人力和時(shí)間。
收集的部分資料存在有圖件無報(bào)告;部分報(bào)告只有封面扉頁和原始資料表格,無正文及相關(guān)的附圖、附件、附表;鉆孔、基坑資料缺乏坐標(biāo)或高程,無法準(zhǔn)確定位。這類資料大多無法正常利用,視其重要性還需補(bǔ)充收集,尤其是鉆孔、基坑的坐標(biāo)(高程)和重要的報(bào)告、圖件、表格、參數(shù)等內(nèi)容。
資料需求不明確,造成整理目標(biāo)不明確。數(shù)據(jù)庫建設(shè)、三維建模和地質(zhì)技術(shù)人員應(yīng)提前討論確定需要的數(shù)據(jù)、表格和圖件等內(nèi)容和格式,資料整理人員才能有的放矢地整理相關(guān)資料。
整理數(shù)據(jù)的可靠性問題。雖然本次整理過程中有多級(jí)質(zhì)量檢查,但因數(shù)據(jù)量極大,資料時(shí)間跨度較長,加之對(duì)地質(zhì)認(rèn)識(shí)的局限性,在整理成果中肯定會(huì)出現(xiàn)紕漏和瑕疵。缺乏一種高效可靠的檢查手段對(duì)整理成果進(jìn)行全面檢查,只能在今后應(yīng)用過程中才能檢驗(yàn)其整理效果。
大數(shù)據(jù)將成為未來國與國之間核心競(jìng)爭力的新體現(xiàn),特別是大數(shù)據(jù)轉(zhuǎn)化為信息和知識(shí)的速度與能力。大數(shù)據(jù)中海量的地質(zhì)數(shù)據(jù)是地質(zhì)學(xué)科學(xué)價(jià)值的表現(xiàn)載體,其服務(wù)與共享在國民經(jīng)濟(jì)建設(shè)、社會(huì)可持續(xù)發(fā)展以及地質(zhì)科學(xué)發(fā)展等方面具有重要的價(jià)值。地質(zhì)大數(shù)據(jù)建庫過程中存量地質(zhì)資料的收集、整理和整合更是面臨著諸多困難和歷史遺留問題,而源數(shù)據(jù)的準(zhǔn)確性和規(guī)范性是建庫成功與否的關(guān)鍵因素,因此,在資料整理過程中需要有詳細(xì)的技術(shù)方法,嚴(yán)格規(guī)范操作,嚴(yán)謹(jǐn)?shù)墓ぷ鲬B(tài)度,以及高度的工作責(zé)任心。
致謝:論文編寫過程中與四川省地質(zhì)調(diào)查院龍杰玲就資料整理過程進(jìn)行了有益探討,在此致以誠摯的謝意!