楊夢梅,黃 波,謝三五,曹利俠,朱仁義
(1.自然資源部第一地理信息制圖院,陜西 西安 710054)
元數(shù)據(jù)是指關(guān)于數(shù)據(jù)的數(shù)據(jù),用以描述數(shù)據(jù)的內(nèi)容、特征、制作過程等多樣信息[1]?,F(xiàn)代測繪生產(chǎn)的產(chǎn)品均有對應(yīng)的元數(shù)據(jù)附件。在測繪軟硬件技術(shù)飛速發(fā)展的新形勢下,重大測繪項目眾多,各類成果數(shù)據(jù)的數(shù)據(jù)體量也呈幾何級增長,以往邊作業(yè)邊記錄元數(shù)據(jù)相關(guān)信息的方式已無法滿足需要,且該方式難免由于人為因素產(chǎn)生一些質(zhì)量缺陷。針對這些問題,目前已有一些學(xué)者進行了元數(shù)據(jù)計算機輔助制作的研究[2],解決了大部分耗費人力的工作,但大多只實現(xiàn)了數(shù)據(jù)范圍、數(shù)據(jù)屬性信息的自動記錄,未實現(xiàn)元數(shù)據(jù)記錄項的全覆蓋。本文從信息覆蓋度和功能適應(yīng)性出發(fā),制定解決方案,進行技術(shù)研發(fā)并制作元數(shù)據(jù)系統(tǒng),開展生產(chǎn)試驗驗證,并分析成果質(zhì)量和制作效率。
元數(shù)據(jù)記錄的信息一般分為固定內(nèi)容(如制作單位等)、數(shù)據(jù)信息(如坐標范圍等)、生產(chǎn)信息(如檢查者等)3類。元數(shù)據(jù)制作可通過設(shè)置模板、采集成果數(shù)據(jù)基本信息[3]、收集生產(chǎn)過程信息、自動匹配填寫等步驟實現(xiàn)。具體技術(shù)方案如圖1所示。
圖1 總體技術(shù)路線
元數(shù)據(jù)的內(nèi)容涉及成果數(shù)據(jù)坐標等空間信息和分辨率等屬性信息。要實現(xiàn)元數(shù)據(jù)內(nèi)容的完全填寫,需對這些信息進行最大程度地全面提取。具體實踐時,利用ArcObject組件庫的眾多接口來實現(xiàn)計算機程序的自動提取,如在提取標準分幅產(chǎn)品的角點坐標記錄時,首先根據(jù)數(shù)據(jù)的標準圖號計算一套理論角點坐標值,然后讀取成果數(shù)據(jù),獲取其數(shù)據(jù)有效范圍,作為真實角點坐標值。通過兩套坐標值來滿足不同項目對于坐標記錄方式的要求。
項目的多樣性導(dǎo)致元數(shù)據(jù)的內(nèi)容要求不盡相同。因此,在實際開發(fā)中,需要設(shè)計一套可配置體系,使用戶可自定義進行信息的對應(yīng)填入,方便用戶操作,提高了軟件的可擴展性和靈活性。在程序設(shè)計時,將提取的信息項名稱和元數(shù)據(jù)的內(nèi)容名稱進行列表可視化,使用自定義對照的形式,完成名稱匹配,并對匹配方案實現(xiàn)本地存儲,隨時調(diào)用。
本文根據(jù)總體技術(shù)路線,開發(fā)對應(yīng)軟件系統(tǒng)來實現(xiàn)元數(shù)據(jù)的自動制作。軟件開發(fā)采用ArcEngine嵌入式組件庫[4]和Office二次開發(fā)組件,ArcEngine主要提供空間數(shù)據(jù)的讀取接口,Office二次開發(fā)組件則提供對于Word、Excel等格式文檔的讀寫接口。軟件為獨立應(yīng)用程序形式,設(shè)計為交互式操作模式。根據(jù)元數(shù)據(jù)的制作業(yè)務(wù)流程和需求,軟件分為模板管理、信息準備、元數(shù)據(jù)制作、圖歷簿制作、信息提取5個模塊,實現(xiàn)完整的元數(shù)據(jù)/圖歷簿的自動制作。軟件總體功能框架如圖2所示。
圖2 總體功能框架設(shè)計
由于具體生產(chǎn)項目的不同,元數(shù)據(jù)的內(nèi)容差異較大。軟件以模板為單元進行區(qū)分管理,設(shè)計了新建模板、修改模板、管理模板等功能,在元數(shù)據(jù)批量制作前,先行完成模板制作。
1)從數(shù)據(jù)獲取信息。測繪成果數(shù)據(jù)包含了豐富的空間和屬性信息,很多信息均能與元數(shù)據(jù)的內(nèi)容對應(yīng)。該功能可獲取的信息項如表1所示。
表1 從數(shù)據(jù)獲取的信息項
2)其他信息內(nèi)容。根據(jù)圖號獲取標準坐標,根據(jù)空間格式的接合表獲取數(shù)據(jù)接邊情況等,用于補充元數(shù)據(jù)所需的一些信息。
元數(shù)據(jù)一般分為常規(guī)文本格式(xls、Access等)和ArcGIS MDB數(shù)據(jù)庫格式。對元數(shù)據(jù)進行信息寫入時的工作流程是一致的,即首先批量生成空元數(shù)據(jù),再根據(jù)前期準備好的信息表進行匹配填入,最后填入一些統(tǒng)一的內(nèi)容。
1)按圖號生成初始元數(shù)據(jù)。根據(jù)文本或shape格式的接合表,讀取圖號字段,再依據(jù)指定的模板批量按圖幅生成初始元數(shù)據(jù)。
2)信息填入。該元數(shù)據(jù)軟件在前期已得到一些所需信息的列表,現(xiàn)將信息通過字段對應(yīng)的方式填入元數(shù)據(jù)中。該功能可列出信息列表和元數(shù)據(jù)的所有字段,用戶自行選擇對應(yīng)的匹配方式,軟件將根據(jù)圖號填入內(nèi)容。該功能的實現(xiàn)界面如圖3所示。
圖3 信息填入界面
圖歷簿一般為Office Word格式,制作工作流程與元數(shù)據(jù)基本一致。其區(qū)別在于,圖歷簿的信息填入是用戶指定對應(yīng)的單元格;圖歷簿需要填寫一個封面信息。該模塊設(shè)計了相應(yīng)功能來完成填寫。
該模塊包括批量提取元數(shù)據(jù)、圖歷簿的指定內(nèi)容和提取元數(shù)據(jù)的模板結(jié)構(gòu)兩個部分。信息提取可用于附件成果的質(zhì)量檢查。
本文利用研發(fā)的軟件,結(jié)合陜西省1∶1萬基礎(chǔ)地理信息更新工程、地理國情監(jiān)測正射影像生產(chǎn)兩個典型案例進行實驗和效率分析。本文利用該軟件參與了完整的產(chǎn)品生產(chǎn),并對各工序進行了時間效率統(tǒng)計,具體如表2所示,可以看出,傳統(tǒng)按圖幅進行人工生產(chǎn)的方式,需逐內(nèi)容逐一獲取、效率低下;而軟件通過信息整合和批量化匹配填寫的方式極大地提高了效率。
表2 元數(shù)據(jù)填寫效率對比/h
本文通過分析元數(shù)據(jù)內(nèi)容的特征,提出了自動制作的技術(shù)路線;并通過多個測繪應(yīng)用項目實踐進行了驗證。該軟件能很好地提高生產(chǎn)成果附件的生產(chǎn)效率,降低人工參與生產(chǎn)的出錯率,保障成果質(zhì)量,節(jié)省生產(chǎn)成本。軟件功能具有較靈活的通用性,適用于常見格式的元數(shù)據(jù)和圖歷簿制作,能很好地服務(wù)于各生產(chǎn)項目。