孔媛媛 ,馬飛飛,路英川,蘇學(xué)影,楊玉霞
(1.武警黃金地質(zhì)研究所,河北 廊坊065000;2.中國地質(zhì)調(diào)查局發(fā)展研究中心,北京 100037;3.全國地質(zhì)資料館,北京 100037)
地質(zhì)資料是地質(zhì)工作成果的重要載體,是地質(zhì)找礦、勘查、地質(zhì)災(zāi)害評估的重要的信息資源。隨著計算機和網(wǎng)絡(luò)技術(shù)的發(fā)展,地質(zhì)工作成果廣泛應(yīng)用于各個領(lǐng)域。地質(zhì)資料信息化建設(shè)以及地質(zhì)資料資源共享顯得尤為重要。
隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)的廣泛應(yīng)用,地質(zhì)資料行業(yè)提出了多個與“地質(zhì)資料服務(wù)中心、數(shù)據(jù)中心”內(nèi)涵相類似的概念。近年來,全國地質(zhì)資料館研發(fā)的“全國地質(zhì)資料目錄服務(wù)中心”就是其中之一。全國地質(zhì)資料館和絕大多數(shù)省級地質(zhì)資料館資料目錄已通過互聯(lián)網(wǎng)公開向社會提供查詢服務(wù),但囿于網(wǎng)絡(luò)現(xiàn)狀和保密管理的制約,目前全國地質(zhì)資料目錄服務(wù)中心互聯(lián)網(wǎng)公開提供的主要是目錄層次的數(shù)據(jù),地質(zhì)資料數(shù)據(jù)中心的建設(shè)不盡人意。與此同時,全國地質(zhì)資料目錄服務(wù)中心通過互聯(lián)網(wǎng)傳遞給用戶,由于計算機網(wǎng)絡(luò)分布的廣域性,網(wǎng)絡(luò)信息安全和版權(quán)問題制約了地質(zhì)資料數(shù)據(jù)中心的安全發(fā)布。
黃金部隊是一支專業(yè)地質(zhì)找礦部隊,以北京黃金指揮部為中心,下設(shè)三個總隊、研究所、教導(dǎo)大隊。三個總隊駐地分別在哈爾濱、廊坊、成都,三個總隊管轄十二個支隊級單位,服務(wù)資料分散、跨區(qū)域共享服務(wù)不足、服務(wù)渠道不暢通、館藏借閱為主、服務(wù)方式單一。長期以來,海量的地質(zhì)資料數(shù)據(jù)資料沒有得到有效的利用,制約當(dāng)前地質(zhì)勘探與地理信息的應(yīng)用。
隨著2011年黃金部隊任務(wù)調(diào)整和轉(zhuǎn)型,黃金部隊業(yè)務(wù)隸屬于國土資源部,在地質(zhì)資料管理上逐步與地方地勘單位接軌。2012年,黃金部隊在全部隊開展了圖文數(shù)字化工作,積累多年的寶貴地質(zhì)資料全面掃描數(shù)字化,建立了寶貴的海量地質(zhì)資料數(shù)據(jù)庫。在此基礎(chǔ)上,基于與互聯(lián)網(wǎng)物理斷開的部隊專網(wǎng)、架設(shè)三級網(wǎng)絡(luò),設(shè)計一套可行、可靠、有效的分布式系統(tǒng),能夠整合分散數(shù)據(jù)、異構(gòu)系統(tǒng),提供不僅包括目錄瀏覽,同時可以在線借閱、在線下載、離線申請等多層次服務(wù)模式的資料目錄服務(wù)系統(tǒng)勢在必行。本文從黃金部隊地質(zhì)資料管理的實際出發(fā),以地質(zhì)資料檔案著錄細則(DA/T23-2000)、地質(zhì)資料電子目錄著錄格式規(guī)定(國土資發(fā)〔2012〕257號)、原始地質(zhì)資料立卷規(guī)則(2008)、實物地質(zhì)資料館藏管理技術(shù)要求為依據(jù),分析了地質(zhì)資料目錄數(shù)據(jù)項標(biāo)準(zhǔn)、對比了地質(zhì)資料管理和地質(zhì)資料匯交軟件的使用情況,提出了黃金部隊地質(zhì)資料目錄服務(wù)系統(tǒng)建設(shè)的思路、總體框架、數(shù)據(jù)組織,對推動黃金部隊地質(zhì)資料信息服務(wù)朝著集群化、產(chǎn)業(yè)化發(fā)展具有深遠意義。
地質(zhì)資料目錄數(shù)據(jù)標(biāo)準(zhǔn)[1]依據(jù)地質(zhì)資料檔案著錄細則(DA/T23-2000)、地質(zhì)資料電子目錄著錄格式規(guī)定(國土資發(fā)〔2012〕257號)、原始地質(zhì)資料立卷規(guī)則(2008)、實物地質(zhì)資料館藏管理技術(shù)要求。地質(zhì)資料檔案著錄細則(DA/T23-2000)規(guī)定了地質(zhì)資料目錄項分9個大項,35個目錄。2001年國土資源部發(fā)布的地質(zhì)資料電子目錄著錄格式規(guī)定(國土資發(fā)〔2012〕257號)規(guī)定了成果地質(zhì)資料目錄數(shù)據(jù)庫建設(shè)的標(biāo)準(zhǔn)。規(guī)定了25個目錄項。2008年實施的原始地質(zhì)資料立卷規(guī)則(2008)規(guī)定了原始地質(zhì)資料的歸檔范圍、歸檔細則。包括卷內(nèi)文件的分類、編目、立卷歸檔的原則,該標(biāo)準(zhǔn)明確了12個文件目錄項。實物地質(zhì)資料館藏管理技術(shù)要求2010年11月正式實施,適應(yīng)于實物地質(zhì)資料的管理工作,該文件規(guī)定了實物地質(zhì)資料是以項目或者礦權(quán)為一個整體來進行管理的。著錄層次為案卷級、部分為文件級,包括鉆孔巖心、標(biāo)本、薄片、光片等實物資料相關(guān)內(nèi)容。
地質(zhì)資料的目錄數(shù)據(jù)分為案卷級和文件級的目錄數(shù)據(jù),通過對案卷級目錄項進行了對比。得出地質(zhì)資料檔案著錄細則(DA/T23-2000)、地質(zhì)資料電子目錄著錄格式規(guī)定(國土資發(fā)〔2012〕257號)、實物地質(zhì)資料館藏管理技術(shù)要求共同擁有的目錄項12項。即:題名、密級、保管期限、形成單位、保護期、其他存放形式資料保存單位、地點、起始經(jīng)緯度、內(nèi)容摘要、檔案館代號、檔號、行政區(qū)劃代碼、主題詞、關(guān)鍵詞。對于文件級目錄,進行了對比分析,文中4個標(biāo)準(zhǔn)中共有的目錄項有12個:件號、檔號、文件題名、文件類型、密級、完成人、完成時間、完成單位、載體數(shù)量、載體單位、載體類型、規(guī)格。分析對比標(biāo)準(zhǔn)規(guī)范的案卷級目錄項、和文件級目錄項對地質(zhì)資料目錄服務(wù)系統(tǒng)的底層數(shù)據(jù)組織具有基礎(chǔ)性意義。
黃金部隊14個基層資料保管單位分布全國各地,數(shù)據(jù)分散保存、地質(zhì)資料目錄管理與服務(wù)體系建設(shè)滯后,缺乏統(tǒng)一管理的平臺,對于地質(zhì)資料分布、總量很難做到資料的快速定位。同時由于各個基層單位參與的項目分布不同,在資料匯交的階段分別匯交到不同的省館館藏機構(gòu)或各大區(qū)地質(zhì)調(diào)查局,在原先各省館針對資料管理和匯交都開發(fā)了自己的軟件,所以我部基層館藏機構(gòu)的數(shù)據(jù)格式和目錄也是五花八門。每年雖然也匯交到北京黃金指揮部,但是只是作為一個成果存檔,格式和目錄也沒有統(tǒng)一要求。這對下一步實現(xiàn)各基層單位資料的數(shù)據(jù)共享,帶來了很大的困難。
針對各基層單位在地質(zhì)資料管理和著錄使用的軟件進行了分類,不外乎各大區(qū)匯交和各省館館藏機構(gòu)的管理軟件。主要分為著錄和管理兩大類。著錄系統(tǒng)主要有成果地質(zhì)資料目錄數(shù)據(jù)庫錄入系統(tǒng)、成果地質(zhì)資料電子文件制作EDMaker、涉密地質(zhì)資料清理。2012年研發(fā)的EDMaker2012軟件是集成了資料的著錄、匯交以及涉密清理,綜合了原始、成果、實物地質(zhì)資料的匯交。地質(zhì)資料管理系統(tǒng)主要包括地質(zhì)資料業(yè)務(wù)管理信息系統(tǒng)、全國地質(zhì)資料匯交監(jiān)管平臺、省館自主研發(fā)地質(zhì)資料管理系統(tǒng)等。
黃金部隊地質(zhì)資料目錄服務(wù)系統(tǒng)是以面向黃金部隊內(nèi)部各個單位服務(wù)為宗旨,以聯(lián)動式共享機制,搭建快捷、實用、靈活的地質(zhì)資料目錄集群服務(wù)框架,由傳統(tǒng)的信息匯集向信息共享服務(wù)轉(zhuǎn)型,主要遵循以下原則。
1)數(shù)據(jù)分散、服務(wù)共享的原則。由于黃金部隊以北京黃金指揮部為主中心,下設(shè)哈爾濱、廊坊、成都三個總隊以及研究所四個分中心,三個總隊各自管轄三個地域不同的支隊。數(shù)據(jù)量大,且分散分布,該系統(tǒng)結(jié)合基層單位是資料的保存單位,負責(zé)資料的管理和發(fā)布,通過分布式服務(wù)技術(shù),搭建統(tǒng)一的服務(wù)平臺,共享數(shù)據(jù)資源。
2)部署簡單、服務(wù)管理便捷的原則。黃金部隊地質(zhì)資料目錄服務(wù)系統(tǒng)采用分布式服務(wù)技術(shù),在主中心和四個分中心分布部署。各個分中心因地域距離較遠,系統(tǒng)在研發(fā)的過程中,考慮適應(yīng)不同軟硬件環(huán)境,易于部署和管理。通過目錄數(shù)據(jù)的聯(lián)合編目、目錄數(shù)據(jù)的更新和服務(wù),給用戶提供簡單便捷的服務(wù)。
3)快速檢索、服務(wù)模式多樣的原則。地質(zhì)資料的作用主要體現(xiàn)在服務(wù)和應(yīng)用,該系統(tǒng)針對地質(zhì)資料的類型不同,分為公開和非公開,非公開又根據(jù)保密期的長短進行了區(qū)分,所以用戶在提交服務(wù)申請時,系統(tǒng)會根據(jù)資料的類型的不同,提供多樣化的服務(wù)模式。對于非公開的數(shù)據(jù),系統(tǒng)提供地質(zhì)資料的存檔位置并以目錄形式提供服務(wù),也可以申請下載,定制申請需求;對于公開服務(wù)的數(shù)據(jù)可提供在線瀏覽和下載;多樣化的服務(wù)模式,用戶可以在最短的時間內(nèi)查閱到所需資料的位置,并根據(jù)需要辦理借閱、下載等手續(xù),大大縮短了資料借閱的時間,節(jié)省了時間和人力。
黃金部隊地質(zhì)資料目錄服務(wù)系統(tǒng)運行的網(wǎng)絡(luò)環(huán)境,首先是單位機關(guān)(支隊、總隊或指揮部)的局域網(wǎng),然后是在授權(quán)條件下通過局域網(wǎng)登錄到黃金部隊的專網(wǎng),實現(xiàn)對其它單位應(yīng)用系統(tǒng)的訪問。系統(tǒng)運行結(jié)構(gòu)的設(shè)計,是指采用何種結(jié)構(gòu)模式解決網(wǎng)絡(luò)環(huán)境下的表示層對應(yīng)用邏輯層及數(shù)據(jù)層的訪問。本系統(tǒng)運行結(jié)構(gòu)中,采用了以Browse/Server為主,集中式運行模式為輔的混合網(wǎng)絡(luò)結(jié)構(gòu)模式。對各業(yè)務(wù)處室,由于辦公地點分布地域廣、人員素質(zhì)差異較大,系統(tǒng)提供B/S模式。這種胖服務(wù)器,瘦客戶端的運行模式下,主要命令執(zhí)行、數(shù)據(jù)計算都在服務(wù)器上完成,而且應(yīng)用程序也安裝在服務(wù)器,客戶機幾乎是零安裝零維護。
系統(tǒng)由三個邏輯層組成:數(shù)據(jù)層、業(yè)務(wù)對象層和客戶層。數(shù)據(jù)層[2]SQL數(shù)據(jù)庫,位于系統(tǒng)的底層。數(shù)據(jù)層主要處理業(yè)務(wù)對象層對數(shù)據(jù)提出的請求和存儲地質(zhì)資料目錄數(shù)據(jù)。業(yè)務(wù)對象層是關(guān)鍵層、核心層,它主要處理如何訪問數(shù)據(jù)、如何請求數(shù)據(jù)分發(fā)到客戶層??蛻魧犹峁?yīng)用接口給客戶,借助Web瀏覽器與后臺數(shù)據(jù)庫交互,實現(xiàn)地質(zhì)資料信息查詢和數(shù)據(jù)的維護。
本系統(tǒng)主要以黃金部隊專網(wǎng)為基礎(chǔ),在黃金指揮部、三個總隊以及14個支隊級單位部署。其中,在指揮部部署目錄中心服務(wù)系統(tǒng)。通過目錄中心服務(wù)系統(tǒng)的前臺子系統(tǒng)。為目錄訪問用戶提供目錄查詢、瀏覽等服務(wù)。系統(tǒng)維護人員通過地質(zhì)資料目錄中心服務(wù)系統(tǒng)對地質(zhì)資料目錄數(shù)據(jù)進行管理,并連接3個總隊級和14個支隊級地質(zhì)資料中心。通過Web Service方式通信,獲得分布式存儲的地質(zhì)資料目錄。
在14個支隊級地質(zhì)資料中心部署館藏單位系統(tǒng),由各個館藏單位的系統(tǒng)維護人員對本地的地質(zhì)資料目錄進行管理,包括數(shù)據(jù)的導(dǎo)入、更新、發(fā)布、定制等,同時通過Web Service與目錄服務(wù)中心的目錄中心服務(wù)系統(tǒng)通信,提供本地的地質(zhì)資料目錄。
此外,在目錄服務(wù)中心和館藏單位部署運維管理系統(tǒng),運維管理模塊貫穿目錄中心服務(wù)系統(tǒng)模塊和各分布式服務(wù)模塊,提供統(tǒng)一的用戶認證、服務(wù)狀態(tài)監(jiān)控、服務(wù)量統(tǒng)計的功能。
黃金部隊地質(zhì)資料目錄服務(wù)中心項目系統(tǒng)的建設(shè)整合[3]各個館藏機構(gòu)目錄數(shù)據(jù)、地調(diào)系統(tǒng)目錄數(shù)據(jù)、行業(yè)系統(tǒng)目錄數(shù)據(jù)及其他地質(zhì)資料目錄數(shù)據(jù),開發(fā)多源異構(gòu)地質(zhì)資料目錄數(shù)據(jù)集成接口,實現(xiàn)黃金部隊地質(zhì)資料目錄數(shù)據(jù)的集成管理。利用分布式數(shù)據(jù)集中與同步技術(shù)、發(fā)布與多元服務(wù)技術(shù)、少量數(shù)據(jù)檢索方案、分布式數(shù)據(jù)管理與統(tǒng)計技術(shù)及目錄服務(wù)產(chǎn)品制作方案為技術(shù)支撐,建設(shè)公益性地質(zhì)資料目錄庫及商業(yè)性地質(zhì)資料目錄庫,開發(fā)目錄數(shù)據(jù)集成與發(fā)布、委托查詢、目錄推送等多元服務(wù)、傳統(tǒng)、空間多元檢索、目錄專題服務(wù)產(chǎn)品生成及數(shù)據(jù)管理與統(tǒng)計等功能模塊。并通過以上功能模塊及分布式的地質(zhì)資料目錄數(shù)據(jù)庫,支撐黃金部隊地質(zhì)資料目錄服務(wù)中心對外提供多種目錄服務(wù)。同時在系統(tǒng)建設(shè)過程中,通過運行機制、標(biāo)準(zhǔn)規(guī)范、安全認證、用戶管理、權(quán)限管理及流程管理等多種方式,對系統(tǒng)運行的規(guī)范性、安全性進行控制,實現(xiàn)系統(tǒng)平穩(wěn)、高效運行。
黃金部隊地質(zhì)資料目錄服務(wù)系統(tǒng)由目錄數(shù)據(jù)中心系統(tǒng)(指揮部、總隊)、館藏單位服務(wù)系統(tǒng)(支隊)和統(tǒng)計身份認證系統(tǒng)三部分組成,如圖1所示。
圖1 系統(tǒng)功能結(jié)構(gòu)圖
目錄數(shù)據(jù)中心系統(tǒng)(指揮部)主要包括前臺服務(wù)系統(tǒng)和后臺系統(tǒng)兩部分,其中前臺系統(tǒng)為用戶提供目錄瀏覽與查詢、地圖檢索及產(chǎn)品定制申請等數(shù)據(jù)服務(wù),后臺管理系統(tǒng)為管理員用戶提供目錄數(shù)據(jù)同步、內(nèi)容管理、分中心管理及運行監(jiān)控等管理服務(wù)(圖2)。館藏單位目錄服務(wù)系統(tǒng)主要包括前臺服務(wù)系統(tǒng)和后臺系統(tǒng)兩部分,其中前臺系統(tǒng)為用戶提供目錄瀏覽與查詢、地圖檢索及產(chǎn)品定制申請等數(shù)據(jù)服務(wù),后臺管理系統(tǒng)為管理員用戶提供目錄服務(wù)接口、目錄數(shù)據(jù)同步接口、目錄數(shù)據(jù)管理及運行監(jiān)控等管理服務(wù)。統(tǒng)一身份認證系統(tǒng)[4]要為用戶提供用戶注冊、單點登錄、數(shù)據(jù)同步、角色管理及后臺配置相關(guān)功能,以支持系統(tǒng)安全平穩(wěn)運行。
圖2 目錄系統(tǒng)數(shù)據(jù)庫架構(gòu)
黃金部隊地質(zhì)資料目錄服務(wù)系統(tǒng)是按照兩級體系架構(gòu)設(shè)計研發(fā)的,分布是以北京黃金指揮部為主中心,以三個總隊、研究所的館藏為分中心,管理數(shù)據(jù)的組織。在各個基層館藏機構(gòu)展開調(diào)研,總結(jié)目錄數(shù)據(jù)的格式,開發(fā)適合各種數(shù)據(jù)格式的數(shù)據(jù)接口,形成多元化的數(shù)據(jù)目錄集合,實現(xiàn)地質(zhì)資料目錄服務(wù)系統(tǒng)提供有效的服務(wù)。館藏機構(gòu)在數(shù)據(jù)目錄管理上,采用分布式服務(wù)技術(shù),通過黃金部隊專網(wǎng),統(tǒng)一發(fā)布到集成的分中心、主中心。分中心和主中心做好數(shù)據(jù)的同步更新。在服務(wù)模式上[5]據(jù)用戶需求,提供在線下載、離線申請等多樣化的服務(wù)模式。
在整合數(shù)據(jù)目錄格式的同時,要依據(jù)國家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn)規(guī)范,研究并制定適合目錄服務(wù)平臺的規(guī)范,例如數(shù)據(jù)訪問服務(wù)接口規(guī)范、地質(zhì)資料目錄數(shù)據(jù)加工規(guī)范等。
北京黃金指揮部設(shè)定的主中心主要包括目錄數(shù)據(jù)集,通過黃金部隊專網(wǎng),實時發(fā)布、實時更新。以哈爾濱、廊坊、成都為主的總隊分中心,主要通過支隊級館藏機構(gòu)的服務(wù)發(fā)布,對公開數(shù)據(jù)和依申請公開的數(shù)據(jù)發(fā)布到各分中心,分中心再通過共享服務(wù)接口提供目錄瀏覽、目錄查詢、數(shù)據(jù)查詢、在線瀏覽、在線下載等多元化的服務(wù)模式。主中心對分中心實時發(fā)布的信息進行數(shù)據(jù)抽取、數(shù)據(jù)審核和數(shù)據(jù)集成,形成公開服務(wù)目錄數(shù)據(jù)庫和依申請公開的目錄數(shù)據(jù)庫,最后實現(xiàn)黃金部隊內(nèi)部各個單位的目錄服務(wù)查詢。
本文通過研究分析黃金部隊地質(zhì)資料管理和服務(wù)現(xiàn)狀,結(jié)合黃金部隊各個基層館藏機構(gòu)的地質(zhì)資料目錄數(shù)據(jù)實際,通過整合各種數(shù)據(jù)源,建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,分析海量數(shù)據(jù)目錄檢索、在線下載、離線申請相關(guān)的多元化的資料服務(wù)模式技術(shù)的實現(xiàn)。重點從體系結(jié)構(gòu)、架構(gòu)設(shè)計、功能結(jié)構(gòu)、數(shù)據(jù)庫設(shè)計等多方面進行了研究和探討,為下一步更好地為黃金部隊地質(zhì)勘查、科研服務(wù)提供技術(shù)支持。
[1] 連健,王黔駒,許百泉,丁克永.我國地質(zhì)資料目管理現(xiàn)狀分析及建議[J].中國礦業(yè),2013,22(9):54-55.
[2] 溫雪茹,翟國平,李銀羅.地質(zhì)資料目錄檢索服務(wù)系統(tǒng)的建設(shè)[J].國土資源信息化,2007(5):10-12.
[3] 馮錳.淺談成果地質(zhì)資料目錄數(shù)據(jù)庫建立及利用[J].內(nèi)蒙古地質(zhì),2002(3):35-37.
[4] 連健,王黔駒,顏世強.全國地質(zhì)資料目錄服務(wù)中心總體設(shè)計研究[J].中國地質(zhì),2013,40(5):1675-1681.
[5] 卜小平,張翠光,趙亞利.全國地質(zhì)資料數(shù)據(jù)中心建設(shè)方案初探[J].國土資源科技管理,2007,24(6):127-131.