楊 斌 徐 博 高 翔
?
地震應(yīng)急基礎(chǔ)數(shù)據(jù)檢查系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[1]
楊 斌1,2)徐 博1,2)高 翔1,2)
1)山西省地震局,太原 030021 2)太原大陸裂谷動(dòng)力學(xué)國(guó)家野外科學(xué)觀測(cè)研究站,太原 030025
地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)是震后災(zāi)害快速評(píng)估及指揮決策的基礎(chǔ),數(shù)據(jù)的質(zhì)量直接影響著指揮決策的準(zhǔn)確性、實(shí)用性。由于數(shù)據(jù)庫(kù)包含數(shù)據(jù)內(nèi)容眾多,來(lái)源多樣,因此數(shù)據(jù)庫(kù)更新時(shí),對(duì)數(shù)據(jù)進(jìn)行檢查必不可少。本文以地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)為目標(biāo),研究了數(shù)據(jù)檢查內(nèi)容及檢查方法,對(duì)數(shù)據(jù)庫(kù)檢查系統(tǒng)的整體架構(gòu)、檢查模塊等進(jìn)行了研究設(shè)計(jì),并將之實(shí)現(xiàn)驗(yàn)證。
地震 數(shù)據(jù)檢查 系統(tǒng)設(shè)計(jì)
前言
地震發(fā)生時(shí)地震應(yīng)急指揮技術(shù)系統(tǒng)在地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)的支持下,可以迅速判斷地震的規(guī)模、影響范圍、經(jīng)濟(jì)損失、人員傷亡等情況,并據(jù)此提出一系列科學(xué)的救災(zāi)方案和調(diào)度方案,協(xié)助指揮人員實(shí)施各種地震救災(zāi)行為,實(shí)現(xiàn)地震應(yīng)急信息快速傳遞、高效處理,提高應(yīng)急救災(zāi)指揮與決策的技術(shù)水平,最大限度地減少震時(shí)的混亂和人員傷亡。地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)是整個(gè)系統(tǒng)的核心與關(guān)鍵,數(shù)據(jù)的質(zhì)量直接影響著整個(gè)數(shù)據(jù)庫(kù)的性能。目前,地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)包含79類數(shù)據(jù),其中空間數(shù)據(jù)52項(xiàng),屬性數(shù)據(jù)27項(xiàng)。整個(gè)數(shù)據(jù)庫(kù)以地市、區(qū)縣、鄉(xiāng)鎮(zhèn)等行政區(qū)劃為基礎(chǔ),其余空間數(shù)據(jù)和屬性數(shù)據(jù)與之對(duì)應(yīng)關(guān)聯(lián)??臻g數(shù)據(jù)的關(guān)聯(lián)主要通過(guò)經(jīng)緯度的空間對(duì)應(yīng),屬性數(shù)據(jù)的關(guān)聯(lián)則主要通過(guò)編碼。由于系統(tǒng)計(jì)算的需要,空間數(shù)據(jù)與空間數(shù)據(jù)、空間數(shù)據(jù)與屬性數(shù)據(jù)、屬性數(shù)據(jù)與屬性數(shù)據(jù)之間有著眾多的關(guān)聯(lián)關(guān)系。
每年數(shù)據(jù)更新時(shí),數(shù)據(jù)編碼的關(guān)聯(lián)性,屬性數(shù)據(jù)的準(zhǔn)確性、完整性,空間數(shù)據(jù)拓?fù)潢P(guān)系的正確性,空間數(shù)據(jù)邏輯一致性等直接影響著系統(tǒng)產(chǎn)出的結(jié)果,都是數(shù)據(jù)檢查的重點(diǎn)。我國(guó)從20世紀(jì)80年代就開(kāi)始了數(shù)據(jù)質(zhì)量控制理論和標(biāo)準(zhǔn)化的研究工作,但大量的研究則是在90年代中后期開(kāi)展,中國(guó)科學(xué)院測(cè)量與地球物理研究所、武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室等機(jī)構(gòu)都在進(jìn)行這方面的研究工作。目前的國(guó)內(nèi)外各種研究機(jī)構(gòu)以及地理信息企業(yè)在數(shù)據(jù)檢查手段上,基本采用在地理信息軟件平臺(tái)上的自主二次開(kāi)發(fā),以實(shí)現(xiàn)在不同軟件平臺(tái)上的基礎(chǔ)地理數(shù)據(jù)檢查。由于研究開(kāi)發(fā)實(shí)力的參差不齊,各單位自主開(kāi)發(fā)實(shí)現(xiàn)的檢查模塊質(zhì)量上也存在差距。廣泛投入使用的基礎(chǔ)地理數(shù)據(jù)檢查模塊產(chǎn)品還很缺乏?,F(xiàn)在的一些研究情況基本上都是針對(duì)各個(gè)城市的特殊數(shù)據(jù)而定制的檢查功能模塊。本文將通過(guò)研究數(shù)據(jù)檢查應(yīng)遵循的原則及常用數(shù)據(jù)檢查方法,針對(duì)地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù),研究數(shù)據(jù)檢查規(guī)則方法及檢查內(nèi)容,設(shè)計(jì)并實(shí)現(xiàn)地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)檢查系統(tǒng)。
1 數(shù)據(jù)檢查原則與方法
1.1 數(shù)據(jù)檢查原則
(1)方便性
數(shù)據(jù)檢查是一項(xiàng)繁瑣細(xì)致的工作,存在大量的重復(fù)性勞動(dòng),數(shù)據(jù)檢查軟件首要原則就是方便性,軟件應(yīng)通過(guò)研究數(shù)據(jù)檢查的規(guī)則,進(jìn)行標(biāo)準(zhǔn)化自動(dòng)檢查,減少人工干預(yù),降低人為操作可能帶來(lái)的錯(cuò)誤率,使數(shù)據(jù)檢查更為高效化、自動(dòng)化。
(2)實(shí)用性
數(shù)據(jù)檢查還應(yīng)體現(xiàn)實(shí)用性,檢查過(guò)程應(yīng)將數(shù)據(jù)的錯(cuò)誤盡可能的顯示、輸出,方便數(shù)據(jù)處理人員找到及修改錯(cuò)誤數(shù)據(jù)。同時(shí)應(yīng)方便數(shù)據(jù)處理人員對(duì)數(shù)據(jù)進(jìn)行標(biāo)注、保存、導(dǎo)出修改后的正確數(shù)據(jù)等。
(3)合理性
合理性也是數(shù)據(jù)檢查應(yīng)遵循的原則,數(shù)據(jù)檢查應(yīng)做到合理、有序。檢查規(guī)則應(yīng)全面合理,不能出現(xiàn)缺漏或自相矛盾的地方,同時(shí)檢查可分層或分類進(jìn)行,每一類檢查對(duì)應(yīng)一個(gè)檢查內(nèi)容,使得數(shù)據(jù)處理人員清晰明白檢查思路及檢查步驟。
1.2 檢查方法
1.2.1 模板匹配法
模板匹配法可用于空間數(shù)據(jù)與屬性數(shù)據(jù)的屬性檢查,每個(gè)數(shù)據(jù)的屬性項(xiàng)由哪些項(xiàng)組成,每一項(xiàng)的定義都可以設(shè)計(jì)成標(biāo)準(zhǔn)控制模板規(guī)則表(范大昭,2001)。在本軟件數(shù)據(jù)檢查過(guò)程中,以地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)規(guī)范為標(biāo)準(zhǔn)文件制作標(biāo)準(zhǔn)模板規(guī)則表,將待檢查數(shù)據(jù)的屬性數(shù)據(jù)與標(biāo)準(zhǔn)模板規(guī)則表匹配,自動(dòng)檢查不符合標(biāo)準(zhǔn)的數(shù)據(jù),圖1表示的即為模板規(guī)則匹配法,圖2為模板規(guī)則示例。
圖2 模板規(guī)則表示例
Fig. 2 Representative cases of the template rule
1.2.2 用戶自定義規(guī)則
空間數(shù)據(jù)之間的關(guān)系包含了相交、重疊、包含等。這些關(guān)系不但存在于同一點(diǎn)、線、面圖層中,還存在于不同點(diǎn)、線、面圖層中。例如數(shù)據(jù)檢查過(guò)程中,既要檢查居民地要素之間不能相交、重疊等,也要檢查居民地圖層與水系圖層之間不能有相交、重疊等。除了這些檢查內(nèi)容,還有一些用戶特定的檢查內(nèi)容,可以通過(guò)用戶自定義規(guī)則來(lái)進(jìn)行檢查。例如某一行政區(qū)內(nèi)的地震監(jiān)測(cè)臺(tái)站,其經(jīng)緯度范圍一般不會(huì)超過(guò)行政區(qū)劃范圍;某一區(qū)域內(nèi)的高層建筑物面積不能超過(guò)房屋總面積等。
本軟件對(duì)空間數(shù)據(jù)及屬性數(shù)據(jù)的數(shù)據(jù)編碼檢查、空間數(shù)據(jù)的坐標(biāo)、投影進(jìn)行檢查將主要利用用戶自定義規(guī)則進(jìn)行。
1.2.3 數(shù)據(jù)交叉檢查
有些數(shù)據(jù)錯(cuò)誤單純的檢查某一單一數(shù)據(jù)表是無(wú)法發(fā)現(xiàn)的,需要將多張數(shù)據(jù)表進(jìn)行疊加、交叉分析才能發(fā)現(xiàn)。例如,由于人工錄入或其他原因,屬性數(shù)據(jù)中經(jīng)緯度所示位置可能和其屬性中標(biāo)注的地名不符,這種錯(cuò)誤單純檢查屬性表是無(wú)法發(fā)現(xiàn)的,需通過(guò)疊加行政區(qū)劃空間數(shù)據(jù),交叉分析經(jīng)緯度所在位置與屬性項(xiàng)標(biāo)注位置是否一致;再如房屋屬性表中包含了各類型房屋面積及房屋總面積,單純檢查房屋屬性表很難確定這些數(shù)字是否正確,通過(guò)將房屋屬性表與人口表進(jìn)行交叉分析可得到行政區(qū)劃內(nèi)的人均住宅面積,使用者可對(duì)人均住宅面積制定合理范圍,超出范圍后,計(jì)算機(jī)自動(dòng)報(bào)警顯示,通過(guò)人機(jī)交互最終確定數(shù)據(jù)是否正確。
本軟件對(duì)數(shù)據(jù)邏輯一致性檢查、數(shù)據(jù)合理性部分檢查將主要利用數(shù)據(jù)交叉檢查法進(jìn)行。
1.2.4 人機(jī)交互檢查
由于數(shù)據(jù)的不確定性,在目前情況下,有時(shí)還需要將數(shù)據(jù)進(jìn)行分析、計(jì)算,將結(jié)果顯示在計(jì)算機(jī)上,通過(guò)人工判斷其正確與否。例如可對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,找出其中遠(yuǎn)遠(yuǎn)超過(guò)或低于平均值的數(shù)據(jù),對(duì)其進(jìn)行判斷;或者將新采集的數(shù)據(jù)與影像數(shù)據(jù)進(jìn)行疊加顯示,從而檢查新數(shù)據(jù)的采集精度。
本軟件對(duì)數(shù)據(jù)合理性部分檢查將主要利用人機(jī)交互檢查法進(jìn)行。
2 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)按照數(shù)據(jù)格式分,主要包含空間數(shù)據(jù)與屬性數(shù)據(jù)兩大類。整個(gè)數(shù)據(jù)庫(kù)以地市、區(qū)縣、鄉(xiāng)鎮(zhèn)等行政區(qū)劃空間數(shù)據(jù)為基礎(chǔ),其余空間數(shù)據(jù)和屬性數(shù)據(jù)通過(guò)數(shù)據(jù)編碼與之對(duì)應(yīng)關(guān)聯(lián)。因此數(shù)據(jù)的編碼正確與否是數(shù)據(jù)檢查的首要任務(wù)。對(duì)于數(shù)據(jù)庫(kù),數(shù)據(jù)的合理性也十分重要。數(shù)據(jù)庫(kù)中的數(shù)據(jù)大多帶有自身的數(shù)據(jù)值,在數(shù)據(jù)收集時(shí),某些專業(yè)數(shù)據(jù)的記錄方式和我們?nèi)粘A?xí)慣不一樣,如果不經(jīng)檢查,直接倒入數(shù)據(jù)庫(kù),也會(huì)對(duì)系統(tǒng)的計(jì)算產(chǎn)出產(chǎn)生影響。所以通過(guò)對(duì)數(shù)據(jù)值本身的合理性檢查,可以初步檢驗(yàn)數(shù)據(jù)的合理性。除數(shù)據(jù)編碼及數(shù)據(jù)合理性外,空間數(shù)據(jù)坐標(biāo)是否符合規(guī)范要求、空間數(shù)據(jù)拓?fù)涫欠裾_、數(shù)據(jù)的完整性、數(shù)據(jù)的邏輯一致性都是直接影響地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)使用的內(nèi)容,也是我們檢查軟件設(shè)計(jì)的方向。
2.1 系統(tǒng)整體設(shè)計(jì)
根據(jù)系統(tǒng)目標(biāo)及檢查內(nèi)容,地震應(yīng)急基礎(chǔ)數(shù)據(jù)檢查系統(tǒng)的總體結(jié)構(gòu)如圖3所示。
(1)數(shù)據(jù)層。數(shù)據(jù)層由關(guān)系數(shù)據(jù)庫(kù)和基礎(chǔ)數(shù)據(jù)庫(kù)組成,其中關(guān)系數(shù)據(jù)庫(kù)用于存儲(chǔ)數(shù)據(jù)檢查的日志、檢查規(guī)則配置文件及系統(tǒng)文件。基礎(chǔ)數(shù)據(jù)庫(kù)用于存儲(chǔ)被檢查的空間數(shù)據(jù)及屬性數(shù)據(jù)。
(2)業(yè)務(wù)層。業(yè)務(wù)層包含了系統(tǒng)的各個(gè)檢查功能模塊,用以對(duì)被查數(shù)據(jù)的空間投影、空間拓?fù)?、?shù)據(jù)完整性、編碼關(guān)聯(lián)、編碼一致、數(shù)據(jù)合理性、邏輯一致性等進(jìn)行檢查。
(3)表現(xiàn)層。即系統(tǒng)主程序界面,是與用戶交互的主界面,承載的系統(tǒng)的主要功能及數(shù)據(jù)加載、數(shù)據(jù)導(dǎo)出、日志查詢、版本顯示等功能。
2.2 檢查模塊設(shè)計(jì)
檢查模塊是整個(gè)系統(tǒng)的核心,其檢查效率及檢查結(jié)果正確性的高低,直接影響著整個(gè)系統(tǒng)的性能。整個(gè)系統(tǒng)的檢查模塊共有六個(gè),如圖3業(yè)務(wù)層所示,各檢查模塊的檢查內(nèi)容如下:
(1)數(shù)據(jù)編碼檢查
整個(gè)數(shù)據(jù)庫(kù)以地市、區(qū)縣、鄉(xiāng)鎮(zhèn)等行政區(qū)劃為基礎(chǔ),其余空間數(shù)據(jù)和屬性數(shù)據(jù)與之對(duì)應(yīng)關(guān)聯(lián)??臻g數(shù)據(jù)的關(guān)聯(lián)主要通過(guò)經(jīng)緯度的空間對(duì)應(yīng),屬性數(shù)據(jù)的關(guān)聯(lián)則主要通過(guò)編碼。空間數(shù)據(jù)與屬性數(shù)據(jù)、屬性數(shù)據(jù)與屬性數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系主要依靠數(shù)據(jù)編碼實(shí)現(xiàn),因此檢查數(shù)據(jù)關(guān)聯(lián)性就是檢查數(shù)據(jù)編碼之間的關(guān)聯(lián)性。地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)的數(shù)據(jù)編碼由14位數(shù)字組成,在數(shù)據(jù)庫(kù)中的數(shù)據(jù)類型為字符型(char),其代碼定義如圖4所示。
上圖所示代碼中,1-6位表示省、市、縣(市、區(qū)),采用《中華人民共和國(guó)行政區(qū)劃代碼(GB/T 2260-1995)》(中國(guó)國(guó)家標(biāo)準(zhǔn)化管理委員會(huì),1995)中規(guī)定的代碼;7-9位表示鄉(xiāng)、鎮(zhèn)或街道辦事處代碼,采用《縣以下行政區(qū)劃代碼編制規(guī)則(GB 10114-88)》(中國(guó)國(guó)家標(biāo)準(zhǔn)化管理委員會(huì),1989)的編碼方法(001-099表示街道辦事處,100-199表示鎮(zhèn),200-399表示鄉(xiāng));10-12位表示行政村、街區(qū)(國(guó)家統(tǒng)計(jì)局行政村、街區(qū)代碼規(guī)則)或重點(diǎn)目標(biāo)代碼(重點(diǎn)目標(biāo)代碼本身占前兩位,第三位補(bǔ)0),13—14位表示自然村或重點(diǎn)目標(biāo)的序號(hào)(聶高眾等,2002)。
數(shù)據(jù)庫(kù)以地市、區(qū)縣、鄉(xiāng)鎮(zhèn)等行政區(qū)劃為基礎(chǔ),其余空間數(shù)據(jù)和屬性數(shù)據(jù)與之對(duì)應(yīng)關(guān)聯(lián),因此,行政區(qū)代碼的準(zhǔn)確性就至關(guān)重要。在行政區(qū)代碼中,也存在關(guān)聯(lián)。區(qū)縣代碼需要和地市代碼關(guān)聯(lián)、鄉(xiāng)鎮(zhèn)代碼需要和區(qū)縣代碼關(guān)聯(lián)、行政村代碼需要和鄉(xiāng)鎮(zhèn)代碼關(guān)聯(lián)(楊斌等,2011)。數(shù)據(jù)關(guān)聯(lián)檢查時(shí),需先檢查行政區(qū)代碼,保證行政區(qū)代碼關(guān)聯(lián)正確。數(shù)據(jù)代碼關(guān)聯(lián)關(guān)系如圖5所示。
(2)數(shù)據(jù)合理性檢查
對(duì)于數(shù)據(jù)庫(kù),數(shù)據(jù)的合理性也十分重要。壞數(shù)會(huì)大大破壞整個(gè)數(shù)據(jù)庫(kù)的穩(wěn)定性與可靠性,對(duì)整個(gè)應(yīng)用系統(tǒng)的產(chǎn)出也會(huì)產(chǎn)生不利影響,降低系統(tǒng)產(chǎn)出結(jié)果的正確性。根據(jù)前文介紹的數(shù)據(jù)檢查方法,數(shù)據(jù)合理性檢查主要通過(guò)以下三個(gè)面進(jìn)行:
①模板規(guī)則檢查數(shù)據(jù)項(xiàng)本身的合理性
數(shù)據(jù)庫(kù)中,每一類數(shù)據(jù)所包含的數(shù)據(jù)項(xiàng),每一個(gè)數(shù)據(jù)項(xiàng)的數(shù)據(jù)類型、數(shù)據(jù)長(zhǎng)度等都不相同,通過(guò)研究數(shù)據(jù)規(guī)范,定義模板規(guī)則,可實(shí)現(xiàn)自動(dòng)檢查所有數(shù)據(jù)的類型是否正確,數(shù)據(jù)長(zhǎng)度是否符合規(guī)定等。
②用戶自定義檢查數(shù)據(jù)合理性
數(shù)據(jù)庫(kù)中的數(shù)據(jù)大多帶有自身的數(shù)據(jù)值,例如人口數(shù)、房屋面積、最高氣溫等。在數(shù)據(jù)收集時(shí),某些專業(yè)數(shù)據(jù)的記錄方式和我們?nèi)粘A?xí)慣不一樣,如果不經(jīng)檢查,直接倒入數(shù)據(jù)庫(kù),也會(huì)對(duì)系統(tǒng)的計(jì)算產(chǎn)出產(chǎn)生影響。所以通過(guò)用戶自定義數(shù)據(jù)值的合理范圍(如圖6所示),可以初步檢驗(yàn)數(shù)據(jù)的合理性。
③數(shù)據(jù)交叉檢查數(shù)據(jù)合理性
通過(guò)數(shù)據(jù)之間的交叉計(jì)算,可進(jìn)一步檢驗(yàn)數(shù)據(jù)的合理性。例如數(shù)據(jù)庫(kù)中人口數(shù)據(jù)可通過(guò)統(tǒng)計(jì)年鑒等渠道獲得,數(shù)據(jù)值較為準(zhǔn)確,通過(guò)以下公式:
房屋總面積/行政區(qū)劃內(nèi)總?cè)丝?行政區(qū)劃內(nèi)人均住宅面積
得出人均住宅面積,可對(duì)房屋數(shù)據(jù)進(jìn)行一定程度的檢驗(yàn)。
(3)邏輯一致性檢查
邏輯一致性主要是檢查空間數(shù)據(jù)在地理數(shù)據(jù)關(guān)系上的一致性,數(shù)據(jù)定義的統(tǒng)一性。即在同一個(gè)數(shù)據(jù)庫(kù)內(nèi),空間數(shù)據(jù)的數(shù)據(jù)定義應(yīng)該保持一致。例如,部分收集到的表格數(shù)據(jù)在依據(jù)其標(biāo)識(shí)的經(jīng)緯度進(jìn)行空間化后,會(huì)出現(xiàn)所在空間位置與屬性中標(biāo)識(shí)不一致的情況,通過(guò)邏輯一致性檢查,可發(fā)現(xiàn)此類錯(cuò)誤。
(4)空間投影檢查
此模塊主要檢查待查空間數(shù)據(jù)的空間投影是否正確。地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)收集到的數(shù)據(jù)投影有北京54、西安80、WGS84、克拉索夫斯基等多種地圖投影,要想保證整個(gè)數(shù)據(jù)庫(kù)的正確性,需對(duì)空間數(shù)據(jù)的投影進(jìn)行檢查糾正。尤其是公里格網(wǎng)人口、公里格網(wǎng)房屋等格網(wǎng)數(shù)據(jù),不同的空間投影,會(huì)造成格網(wǎng)數(shù)據(jù)與其他數(shù)據(jù)疊加運(yùn)算時(shí),產(chǎn)生極大誤差,直接影響后續(xù)業(yè)務(wù)系統(tǒng)的正常運(yùn)行。
(5)空間拓?fù)錂z查
拓?fù)錂z查是空間數(shù)據(jù)檢查的重點(diǎn),空間數(shù)據(jù)中行政區(qū)劃等面域是否閉合,道路等線性數(shù)據(jù)連接是否正確,空間數(shù)據(jù)是否正確的表達(dá)了目標(biāo)之間的領(lǐng)接、包含等關(guān)系。
(6)數(shù)據(jù)完整性檢查
數(shù)據(jù)完整性檢查主要檢查空間數(shù)據(jù)及屬性數(shù)據(jù)的屬性項(xiàng)是否完整,是否存在缺項(xiàng),或每一項(xiàng)內(nèi)是否有空缺數(shù)據(jù)等。
3 應(yīng)用示例與結(jié)果分析
系統(tǒng)以Arcengine平臺(tái)和C#語(yǔ)言為基礎(chǔ),同時(shí)結(jié)合數(shù)據(jù)庫(kù)日常運(yùn)行維護(hù)實(shí)踐經(jīng)驗(yàn),實(shí)現(xiàn)了地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)的數(shù)據(jù)編碼檢查、數(shù)據(jù)合理性檢查、錯(cuò)誤提示、數(shù)據(jù)輸出等功能,如圖7所示。
用戶界面上方是菜單欄,可對(duì)檢查數(shù)據(jù)進(jìn)行編碼檢查、合理性檢查、數(shù)據(jù)提取、數(shù)據(jù)合并等操作。用戶界面左下方是數(shù)據(jù)配置區(qū)域,主要進(jìn)行待檢查數(shù)據(jù)、檢查報(bào)告、檢查結(jié)果數(shù)據(jù)的配置;用戶界面右下方是檢查過(guò)程描述區(qū)域,用戶可在此查看檢查的詳細(xì)過(guò)程。數(shù)據(jù)檢查過(guò)程示意如圖8所示。
軟件對(duì)數(shù)據(jù)的檢查結(jié)果主要是數(shù)據(jù)檢查報(bào)告及檢查后輸出的檢查數(shù)據(jù)庫(kù)兩個(gè)成果,示意圖分見(jiàn)圖9、圖10。檢查報(bào)告以excel表格的形式,記錄了被檢查數(shù)據(jù)的數(shù)據(jù)名稱、檢查類型、錯(cuò)誤類型、錯(cuò)誤數(shù)目等信息。檢查后輸出的檢查數(shù)據(jù)庫(kù)為mdb數(shù)據(jù),并在數(shù)據(jù)庫(kù)的每個(gè)數(shù)據(jù)表后,新增ErrorType字段記錄錯(cuò)誤類型,方便數(shù)據(jù)維護(hù)人員查找修改。
圖9 數(shù)據(jù)檢查報(bào)告示意圖
Fig. 9 Data Inspection report
通過(guò)軟件的實(shí)際使用發(fā)現(xiàn),軟件完成了系統(tǒng)設(shè)計(jì)的目標(biāo),實(shí)現(xiàn)了對(duì)地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)的數(shù)據(jù)編碼、空間數(shù)據(jù)坐標(biāo)、數(shù)據(jù)合理性等的檢查。但由于影響數(shù)據(jù)質(zhì)量因素是多階段、多方面的,從數(shù)據(jù)獲取到數(shù)據(jù)處理到數(shù)據(jù)輸出都有數(shù)據(jù)誤差的產(chǎn)生和擴(kuò)散,本軟件只是結(jié)合地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)規(guī)范,對(duì)數(shù)據(jù)編碼及數(shù)據(jù)合理性的部分內(nèi)容檢查進(jìn)行了探討。其中數(shù)據(jù)交叉檢查目前只涉及了房屋、人口等較少的數(shù)據(jù),今后需要不斷擴(kuò)展數(shù)據(jù)交叉檢查范圍,提升數(shù)據(jù)相互驗(yàn)證能力。
4 結(jié)語(yǔ)
數(shù)據(jù)質(zhì)量檢查是一項(xiàng)系統(tǒng)工程,檢查的結(jié)果直接影響著數(shù)據(jù)庫(kù)質(zhì)量,地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)又是地震應(yīng)急指揮技術(shù)系統(tǒng)的核心,數(shù)據(jù)庫(kù)的質(zhì)量直接影響著震后災(zāi)害快速評(píng)估與指揮決策的準(zhǔn)確性、可用性。目前地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)含79類數(shù)據(jù),數(shù)據(jù)來(lái)源的多樣性以及數(shù)據(jù)處理標(biāo)準(zhǔn)的不規(guī)范,使得數(shù)據(jù)檢查不能忽略。本文研究探討了數(shù)據(jù)檢查的原則及方法,結(jié)合地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù),設(shè)計(jì)了數(shù)據(jù)檢查軟件的系統(tǒng)目標(biāo)、系統(tǒng)架構(gòu)及檢查模塊。并通過(guò)制定標(biāo)準(zhǔn)模板規(guī)則、用戶自定義規(guī)則等,使系統(tǒng)的擴(kuò)展性、靈活性增強(qiáng),在實(shí)際應(yīng)用中取得了較好效果,提高了地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)質(zhì)量,為地震應(yīng)急指揮技術(shù)系統(tǒng)產(chǎn)出質(zhì)量的提升,打下了堅(jiān)實(shí)的基礎(chǔ)。
范大昭,2001.?dāng)?shù)字地圖矢量數(shù)據(jù)檢查的研究與實(shí)踐.碩士論文,中國(guó)人民解放軍信息工程大學(xué)測(cè)繪學(xué)院,28.
聶高眾,陳建英,李志強(qiáng)等,2002.地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)建設(shè).地震,22(3):105—112.
楊斌,程紫燕,寧亞靈,2011.基于SQL語(yǔ)言的地震應(yīng)急基礎(chǔ)數(shù)據(jù)庫(kù)數(shù)據(jù)關(guān)聯(lián)性一致性及可靠性檢查.山西地震,36—39.
中國(guó)國(guó)家標(biāo)準(zhǔn)化管理委員會(huì),1995.《中華人民共和國(guó)行政區(qū)劃代碼》(GB/T 2260-1995)北京:中國(guó)標(biāo)準(zhǔn)出版社
中國(guó)國(guó)家標(biāo)準(zhǔn)化管理委員會(huì),1989.《縣以下行政區(qū)劃代碼編制規(guī)則》(GB 10114-88)北京:中國(guó)標(biāo)準(zhǔn)出版社.
Design and Implementation of Basic Data Checking System of Earthquake Emergency
Yang Bin1, 2), Xu Bo1, 2)and Gao Xiang1, 2)
1) Earthquake Administration of Shanxi Province, Taiyuan 030021, China 2) Taiyuan Continental Rift Dynamics National Field Scientific Observation and Research Station, Taiyuan 030025, China
Earthquake database is the basis for rapid assessment and command decision after hazardous earthquakes, and the quality of the data command decision directly affects the accuracy and practicality. Since the database contains a number of data contents and diverse sources, the data checking is essential when the database is updated. In this paper, we studied the data checking contents and methods based on the database of earthquake emergency response, including the overall structure and module of the database, validation and implementation.
Earthquake; Data check; System design
[1] 基金項(xiàng)目 地震科技星火計(jì)劃項(xiàng)目(XH14009Y)、地震行業(yè)科研專項(xiàng)(201208018)、山西省基礎(chǔ)研究計(jì)劃項(xiàng)目(2012021017)和地震應(yīng)急青年重點(diǎn)任務(wù)(CEA_EDEM-201403)共同資助
[收稿日期]2015-03-20
[作者簡(jiǎn)介]楊斌,男,生于1981年。碩士,工程師。主要從事地震應(yīng)急技術(shù)的研究。E-mail:ybsuning@163.com。
楊斌,徐博,高翔,2016.地震應(yīng)急基礎(chǔ)數(shù)據(jù)檢查系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).震災(zāi)防御技術(shù),11(1):144—152.
doi:10.11899/zzfy20160116